基于Web日志挖掘的推荐系统研究

论文摘要

Web日志挖掘是研究用户Web浏览行为的主要技术和工具,了解用户的浏览兴趣是提高Web服务质量和改善站点结构设计的重要环节。通过分析和研究用户访问情况的规律,可以识别电子商务的潜在客户,增强服务器质量,并改进Web服务器系统的结构和性能。Web挖掘技术的一个重要的研究方向是Web用户聚类和页面聚类,即通过用户对网站的使用信息—Web日志文件的处理和研究,得到具有相似访问兴趣的用户群体和用户共同感兴趣的站点的URL,据此可以判别和调整站点的结构并进行个性化服务。本文对基于Web日志挖掘的推荐系统进行研究。首先,对Web日志挖掘中数据预处理过程(包括数据净化、用户识别、会话识别、路径补充和事务识别等)进行了研究,分析了各个步骤的目的、方法,给出每个步骤的实现算法;其次,从用户聚类,页面聚类和频繁访问路径三方面考虑网络浏览模式,给出一些相关定义,并在原有的聚类算法基础上,应用基于向量和模糊集理论的算法对用户和页面进行有效的聚类,并产生频繁访问路径,从而为用户进行个性化推荐;最后,基于上述研究设计实现了基于Web日志挖掘的推荐系统。

论文目录

内容提要

第1章引言

1.1 研究背景

1.2 研究现状

1.3 论文主要工作及组织结构

第2章相关理论和技术

2.1 Web 数据挖掘

2.1.1 Web 挖掘的基本概念

2.1.2 Web 挖掘的分类

2.2 Web 日志挖掘

2.2.1 Web 日志

2.2.2 Web 日志挖掘的过程

2.2.3 Web 日志挖掘的应用

2.3 个性化服务

2.3.1 研究背景

2.3.2 研究现状

第3章 Web 日志预处理过程研究

3.1 数据净化

3.2 用户识别

3.3 会话识别

3.4 路径补充

3.5 事务识别

第4章改进的权值矩阵聚类算法

4.1 聚类算法研究背景

4.2 相关的定义

4.3 基于向量聚类算法

4.3.1 用户聚类算法

4.3.2 Web 页面聚类算法

4.3.3 频繁访问路径发现算法

4.4 基于模糊集理论的聚类算法

4.4.1 相关理论

4.4.2 相关算法

4.5 个性化推荐算法

第5章基于Web 日志挖掘的个性化推荐系统研究

5.1 系统设计

5.1.1 离线部分

5.1.2 在线部分

5.2 系统特点

5.3 实验环境和开发工具

5.3.1 实验环境

5.3.2 开发工具

5.4 模块主要功能

5.4.1 系统主界面

5.4.2 子模块界面及实现代码

第6章总结与展望

6.1 总结

6.2 展望

参考文献

摘要

Abstract

致谢

基于Web日志挖掘的推荐系统研究

论文摘要

论文目录

相关论文文献