论文摘要
在大规模数据集快速增长的今天,数据挖掘已成为目前信息领域和数据库技术的前沿研究课题,它使数据处理技术进入了一个更高级的阶段,被公认为是最具发展前景的未来信息处理骨干技术之一。作为知识发现过程,数据挖掘的宗旨在于从原始数据中得到“被证实的知识”。本文首先对数据挖掘技术的产生和发展做了介绍,对目前数据挖掘技术的现状、存在的问题及挑战做了详细的分析,其次对数据挖掘技术的发展做了展望。面对电子商务的飞速发展,文中还对电子商务做了介绍并分析了电子商务和数据挖掘技术之间的关系。数据挖掘技术在客户关系管理(Customer Relations Management,CMR)中的应用是近年来研究的焦点。本文研究了数据挖掘技术作为在大量数据中挖掘出有用知识的强有力工具在CMR中的高效应用:它不仅能够从与客户有关的大量数据中挖掘出对企业有价值的知识和规则,还能使企业更好地了解客户,为企业以后的发展决策提供信息支持。本文同时分析了数据挖掘技术在CRM的主要流程和应用。电子商务推荐系统作为提高企业服务水平、实现企业效益最大化,满足客户个性化要求的优秀工具,越来越被人们所推崇。本文针对电子商务推荐系统做了深入的研究,主要介绍了电子商务推荐系统中使用的常用数据挖掘技术,对关联规则算法和聚类算法的原理做了说明,并对关联规则经典算法Apriori算法做了分析运算。重点对聚类经典算法K-平均算法做了详细的分析和计算,并提出了一种改进算法。基于提出的改进K-平均算法,本文继而提出了一套电子商务推荐系统框架结构,并利用新算法对某一电子商务网站中的产品销售及评价数据进行了采集和预处理,模拟进行了聚类算法实验,并给出了实例分析,验证了算法的有效性,最后根据实验分析了新算法的优点和缺点。最后,本文对作者所完成的工作做了归纳和总结,提出了下一步的研究方向。