论文题目: Web日志挖掘技术的研究与应用
论文类型: 硕士论文
论文专业: 计算机应用技术
作者: 陈文臣
导师: 柳勇
关键词: 日志,挖掘,关联规则,兴趣度,个性化推荐
文献来源: 中国科学院研究生院(计算技术研究所)
发表年度: 2005
论文摘要: 随着计算机技术和Internet的发展,在各种Web服务器上的用户访问记录数据也飞速膨胀,尽管传统的数据库技术和数据挖掘技术已经取得了飞速的发展,但由于Web日志数据很多是不完整的、冗余的、错误的数据,所以很多传统的数据挖掘技术不能直接应用在Web日志挖掘上,即使有些技术可用也是需要建立在对Web日志数据进行预处理的基础之上。Web日志挖掘旨在通过对Web日志进行有效的数据挖掘,发掘隐藏在日志数据背后的规律和模式。通过对Web日志的挖掘和对用户访问行为、频度、内容等分析,我们可以从大量的Web日志信息提取出我们需要的有用知识,并且由此可以得到用户的访问模式,从而改进我们的Web站点设计,更重要的是,通过对这些用户特征的理解和分析,可以向用户提供个性化的服务。本文对Web日志挖掘的各个方面都进行了较为深入的研究。首先在总结国内外Web日志挖掘的研究现状基础上,详细介绍Web日志数据预处理的过程;其次基于Web日志预处理的结果,综合关联规则算法在Web日志挖掘方面的应用,提出了一个基于兴趣度选择的关联规则算法,该算法不仅利用了Web日志数据,而且还结合Web页面内容信息、Web页面文件大小和Web站点的拓扑结构等信息,同时应用兴趣度来度量关联规则的质量,从而极大地提高了所得规则的兴趣度,由此得出高兴趣度的用户频繁访问页组和用户访问模式;最后在该算法的基础上,提出了一种实现在线的个性化推荐方法,这个方法根据兴趣度选择算法和模式匹配算法得到用户相应的页面推荐集,进而利用Web服务器上的在线推荐引擎对用户进行在线的个性化推荐。
论文目录:
摘要
Abstract
图目录
表目录
第一章 绪论
1.1 Web日志挖掘的研究背景及意义
1.2 Web日志挖掘研究现状分析
1.3 论文的工作与组织结构
1.3.1 论文的主要工作
1.3.2 论文的组织结构
1.4 本章小结
第二章 Web日志挖掘概述
2.1 数据挖掘技术
2.1.1 数据挖掘的产生
2.1.2 数据挖掘定义
2.1.3 数据挖掘系统分类
2.1.4 数据挖掘的主要过程
2.2 Web挖掘
2.2.1 Web挖掘概述
2.2.2 Web内容挖掘
2.2.3 Web结构挖掘
2.2.4 Web日志挖掘
2.3 Web日志挖掘概述
2.3.1 Web日志挖掘的定义
2.3.2 Web日志挖掘的过程
2.3.2.1 数据预处理
2.3.2.2 模式发现
2.3.2.3 模式分析及应用
2.3.3 Web日志挖掘的应用
2.3.4 隐私问题
2.4 本章小节
第三章 Web日志预处理技术
3.1 数据预处理技术
3.2 Web日志预处理相关技术
3.2.1 数据的收集
3.2.1.1 可使用的数据
3.2.1.2 数据源
3.2.2 数据抽象(Data Abstract)
3.2.3 Web日志数据挖掘的难点
3.3 Web日志预处理过程
3.3.1 数据清理(Data Cleaning)
3.3.2 用户识别(User Identification)
3.3.3 会话识别(Session Identification)
3.3.4 路径补充(Path Completion)
3.3.5 事务识别(Transaction Identification)
3.4 本章小结
第四章 兴趣度选择算法
4.1 关联规则
4.1.1 关联规则概述
4.1.2 Apriori算法
4.1.3 Apriori算法的改进
4.2 Web日志中关联规则的兴趣度
4.3 兴趣度选择算法
4.3.1 范化内容链接比(NCLR)
4.3.2 组内链接度(GILD)
4.3.3 兴趣度选择算法
4.4 算法实验及比较
4.5 本章小结
第五章 利用关联规则实现在线的个性化推荐
5.1 个性化简介
5.2 系统结构
5.3 在线个性化推荐
5.3.1 模式匹配
5.3.2 推荐形式
5.4 在线个性化推荐的实现
5.4.1 日志数据预处理的实现
5.4.2 频繁访问页组模式库
5.4.3 频繁访问页组挖掘算法
5.4.4 基于频繁访问页组模式库的推荐算法
5.5 本章小结
第六章 结束语
6.1 工作总结
6.2 进一步工作的展望
参考文献
致谢
作者简历
发布时间: 2006-12-26
参考文献
- [1].Web日志挖掘在网站个性化服务中的应用研究[D]. 赵晶晶.大连海事大学2009
- [2].基于概念格的Web日志挖掘及其应用[D]. 王英强.西安电子科技大学2011
- [3].基于WEB日志挖掘的个性化服务技术的研究[D]. 熊熙.湖北工业大学2010
- [4].Web日志挖掘技术在尚品网个性化服务的应用研究[D]. 曲烁.天津大学2014
- [5].Web日志挖掘系统的研究与实现[D]. 王赋聪.北京邮电大学2015
- [6].基于Web日志挖掘的网站优化技术与应用[D]. 史振华.武汉理工大学2010
- [7].基于人工免疫系统的Web日志挖掘应用研究[D]. 吕佳.重庆大学2006
- [8].WEB日志挖掘的研究和实现[D]. 王丽娜.郑州大学2005
- [9].基于web日志挖掘的个性化服务研究[D]. 于亚秀.华东师范大学2010
- [10].基于Web日志挖掘的推荐系统研究[D]. 王蕾.吉林大学2008
相关论文
- [1].基于Web日志的数据挖掘及其在Web预取中的应用研究[D]. 张为.华中科技大学2006
- [2].蚁群算法在Web日志挖掘中的研究与应用[D]. 谢琴.重庆大学2006
- [3].基于Web日志的数据挖掘[D]. 蒋英华.天津大学2006
- [4].Web日志挖掘技术的研究[D]. 李向云.大庆石油学院2007
- [5].基于Web日志挖掘的个性化服务[D]. 吴佳楠.吉林大学2007
- [6].Web日志挖掘相关算法研究及其原型系统设计[D]. 冯洁.西南交通大学2007
- [7].Web日志挖掘及其实现[D]. 刘滨.哈尔滨工程大学2007
- [8].Web日志挖掘相关算法研究[D]. 詹宇斌.国防科学技术大学2006
- [9].基于Web日志的数据挖掘研究[D]. 付国瑜.重庆大学2007
- [10].WEB日志挖掘的研究和实现[D]. 王丽娜.郑州大学2005