论文摘要
Web日志挖掘是研究用户Web浏览行为的主要技术和工具,了解用户的浏览兴趣是提高Web服务质量和改善站点结构设计的重要环节。通过分析和研究用户访问情况的规律,可以识别电子商务的潜在客户,增强服务器质量,并改进Web服务器系统的结构和性能。Web挖掘技术的一个重要的研究方向是Web用户聚类和页面聚类,即通过用户对网站的使用信息—Web日志文件的处理和研究,得到具有相似访问兴趣的用户群体和用户共同感兴趣的站点的URL,据此可以判别和调整站点的结构并进行个性化服务。本文对基于Web日志挖掘的推荐系统进行研究。首先,对Web日志挖掘中数据预处理过程(包括数据净化、用户识别、会话识别、路径补充和事务识别等)进行了研究,分析了各个步骤的目的、方法,给出每个步骤的实现算法;其次,从用户聚类,页面聚类和频繁访问路径三方面考虑网络浏览模式,给出一些相关定义,并在原有的聚类算法基础上,应用基于向量和模糊集理论的算法对用户和页面进行有效的聚类,并产生频繁访问路径,从而为用户进行个性化推荐;最后,基于上述研究设计实现了基于Web日志挖掘的推荐系统。
论文目录
内容提要第1章 引言1.1 研究背景1.2 研究现状1.3 论文主要工作及组织结构第2章 相关理论和技术2.1 Web 数据挖掘2.1.1 Web 挖掘的基本概念2.1.2 Web 挖掘的分类2.2 Web 日志挖掘2.2.1 Web 日志2.2.2 Web 日志挖掘的过程2.2.3 Web 日志挖掘的应用2.3 个性化服务2.3.1 研究背景2.3.2 研究现状第3章 Web 日志预处理过程研究3.1 数据净化3.2 用户识别3.3 会话识别3.4 路径补充3.5 事务识别第4章 改进的权值矩阵聚类算法4.1 聚类算法研究背景4.2 相关的定义4.3 基于向量聚类算法4.3.1 用户聚类算法4.3.2 Web 页面聚类算法4.3.3 频繁访问路径发现算法4.4 基于模糊集理论的聚类算法4.4.1 相关理论4.4.2 相关算法4.5 个性化推荐算法第5章 基于Web 日志挖掘的个性化推荐系统研究5.1 系统设计5.1.1 离线部分5.1.2 在线部分5.2 系统特点5.3 实验环境和开发工具5.3.1 实验环境5.3.2 开发工具5.4 模块主要功能5.4.1 系统主界面5.4.2 子模块界面及实现代码第6章 总结与展望6.1 总结6.2 展望参考文献摘要Abstract致谢
相关论文文献
标签:日志挖掘论文; 个性化推荐论文; 聚类论文;