基于Web日志挖掘的推荐系统研究

基于Web日志挖掘的推荐系统研究

论文摘要

Web日志挖掘是研究用户Web浏览行为的主要技术和工具,了解用户的浏览兴趣是提高Web服务质量和改善站点结构设计的重要环节。通过分析和研究用户访问情况的规律,可以识别电子商务的潜在客户,增强服务器质量,并改进Web服务器系统的结构和性能。Web挖掘技术的一个重要的研究方向是Web用户聚类和页面聚类,即通过用户对网站的使用信息—Web日志文件的处理和研究,得到具有相似访问兴趣的用户群体和用户共同感兴趣的站点的URL,据此可以判别和调整站点的结构并进行个性化服务。本文对基于Web日志挖掘的推荐系统进行研究。首先,对Web日志挖掘中数据预处理过程(包括数据净化、用户识别、会话识别、路径补充和事务识别等)进行了研究,分析了各个步骤的目的、方法,给出每个步骤的实现算法;其次,从用户聚类,页面聚类和频繁访问路径三方面考虑网络浏览模式,给出一些相关定义,并在原有的聚类算法基础上,应用基于向量和模糊集理论的算法对用户和页面进行有效的聚类,并产生频繁访问路径,从而为用户进行个性化推荐;最后,基于上述研究设计实现了基于Web日志挖掘的推荐系统。

论文目录

  • 内容提要
  • 第1章 引言
  • 1.1 研究背景
  • 1.2 研究现状
  • 1.3 论文主要工作及组织结构
  • 第2章 相关理论和技术
  • 2.1 Web 数据挖掘
  • 2.1.1 Web 挖掘的基本概念
  • 2.1.2 Web 挖掘的分类
  • 2.2 Web 日志挖掘
  • 2.2.1 Web 日志
  • 2.2.2 Web 日志挖掘的过程
  • 2.2.3 Web 日志挖掘的应用
  • 2.3 个性化服务
  • 2.3.1 研究背景
  • 2.3.2 研究现状
  • 第3章 Web 日志预处理过程研究
  • 3.1 数据净化
  • 3.2 用户识别
  • 3.3 会话识别
  • 3.4 路径补充
  • 3.5 事务识别
  • 第4章 改进的权值矩阵聚类算法
  • 4.1 聚类算法研究背景
  • 4.2 相关的定义
  • 4.3 基于向量聚类算法
  • 4.3.1 用户聚类算法
  • 4.3.2 Web 页面聚类算法
  • 4.3.3 频繁访问路径发现算法
  • 4.4 基于模糊集理论的聚类算法
  • 4.4.1 相关理论
  • 4.4.2 相关算法
  • 4.5 个性化推荐算法
  • 第5章 基于Web 日志挖掘的个性化推荐系统研究
  • 5.1 系统设计
  • 5.1.1 离线部分
  • 5.1.2 在线部分
  • 5.2 系统特点
  • 5.3 实验环境和开发工具
  • 5.3.1 实验环境
  • 5.3.2 开发工具
  • 5.4 模块主要功能
  • 5.4.1 系统主界面
  • 5.4.2 子模块界面及实现代码
  • 第6章 总结与展望
  • 6.1 总结
  • 6.2 展望
  • 参考文献
  • 摘要
  • Abstract
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  

    基于Web日志挖掘的推荐系统研究
    下载Doc文档

    猜你喜欢