论文题目: 基于Web挖掘实现网站自适应
论文类型: 硕士论文
论文专业: 计算机应用
作者: 陈婷
导师: 郭平
关键词: 自适应网站,挖掘,用户访问模式,个性化推荐
文献来源: 重庆大学
发表年度: 2005
论文摘要: 随着Web站点自身信息越来越丰富和拓扑结构越来越复杂,目前信息服务中普遍存在着“信息过载”和“资源迷向”的状况。从用户的角度,不同的用户有不同的访问目的,而同一个用户在不同时期的访问兴趣也可能会发生变化。对网站来说,只有迅速满足用户的访问需求,提高信息服务质量,才能创造更大的经济效益。为了解决来自用户和网站双方面的问题,自适应网站应运而生,它通过学习用户访问模式,呈现不同的界面给不同的用户并且完善网站自身拓扑结构。网站自适应技术从1996年开始就已经成为人工智能领域的研究热点,近年来伴随着数据挖掘技术的不断成熟,以数据挖掘为支持的网站自适应技术已经取得了一些重要的理论和实践成果。准确及时的掌握用户对网站的访问情况是确保网站高效地实现自适应性的重要依据。本文主要研究如何利用Web挖掘分析日志以获得这些信息,并且转化成站点的智能,使其自适应的提供个性化推荐,改变用户视图和优化网站结构。为此,本文主要做了以下几个方面的研究工作:(1)分析研究自适应网站的需求,讨论用户访问模型的建立,以及基于Web使用挖掘可以获得的各种用户访问模式。(2)为了从Web Log文件内容向各种挖掘算法提供准确的数据源,对Web使用挖掘日志预处理工作中的问题进行了讨论。(3)分析经典数据挖掘方法应用于实现站点自适应的优缺点,针对其存在的问题,分别从关联规则模式、序列模式和聚类模式三个方面提出实现个性化推荐的算法。并且提出了利用蚁群算法内在的并行性解决日志海量更新的思想。(4)为了通过客观化的度量来确保自适应网站的性能,本文讨论了各种衡量各种推荐系统的指标。以重庆大学网站为平台,从理论和实验角度对上述Web挖掘技术进行评价,研究综合利用这几种模式实现站点自适应的方法。(5)提出一个自适应网站的原型系统,从而验证了运用相关技术实现网站自适应是可行的。本文应用Web挖掘技术从访问日志中提取用户访问模式,将挖掘到的知识转变为站点的智能,实现站点自适应。自适应网站的研究有利于提高站点信息服务质量,促进智能信息处理领域的发展,在理论和实践上都有重要的研究意义。
论文目录:
中文摘要
英文摘要
1 绪论
1.1 论文选题背景和研究意义
1.2 WEB 挖掘和自适应网站研究现状
1.3 本文研究内容
2 相关概念和技术
2.1 数据挖掘和WEB 挖掘
2.1.1 数据挖掘
2.1.2 Web 数据挖掘
2.1.3 Web 数据挖掘的难点
2.2 关联规则
2.2.1 关联规则描述
2.2.2 Apriori 算法
2.2.3 Apriori 算法分析改进
2.3 FP—GROWTH 算法
2.3.1 挖掘 FP-tree
2.4 聚类规则
2.4.1 聚类分析的主要方法
2.4.2 蚁群聚类
2.5 本章小结
3 日志数据预处理分析
3.1 自适应需求分析
3.2 从WEB 挖掘的角度看网络
3.3 用户访问模式
3.4 WEB 使用挖掘的数据预处理
3.4.1 日志记录
3.4.2 数据预处理的四个阶段
3.5 本章小结
4 基于关联规则的挖掘
4.1 关联规则应用于推荐
4.1.1 推荐思想
4.1.2 推荐步骤
4.1.3 存在问题
4.2 相关工作
4.3 应用关联规则的改进—目标网页期望定位
4.3.1 问题提出
4.3.2 访问模式分析
4.3.3 会话序列的提取
4.3.4 挖掘频繁序列算法FFS
4.3.5 生成推荐链接列表(RLL)
4.3.6 实验分析
4.4 应用关联规则的改进—闭相关页面集
4.4.1 问题提出
4.4.2 基于位矢量建立网站访问模型
4.4.3 挖掘闭相关页面集
4.4.4 实验分析
4.5 本章小结
5 基于聚类方法的挖掘
5.1 蚁群算法(ANT COLONY ALGORITHM)
5.2 LF 算法分析和改进
5.3 信息素和短时间记忆对蚂蚁移动的影响
5.4 AACA(ADAPTIVE ANT COLONY ALGORITHM)算法
5.5 AACA 算法(AACA)挖掘相关页面集
5.5.1 网站访问模型
5.5.2 增量式挖掘相关页面集
5.6 试验分析
5.7 本章小结
6 实现网站自适应
6.1 问题提出
6.2 动态推荐的实现
6.2.1 建立推荐树
6.2.2 推荐树生成推荐图
6.2.3 推荐图实现网站自适应
6.3 评价测度
6.4 两种挖掘相关页面集方法的比较
6.5 本章小结
7 自适应网站的原型系统
7.1 设计思想
7.2 体系结构
7.3 系统功能
7.3.1 离线处理部分
7.3.2 在线推荐部分
7.4 系统接口设计
7.5 系统实现
7.6 本章小结
8 总结
8.1 本文的主要贡献
8.2 一些重要结论
8.3 进一步的工作
致谢
参考文献
附录:作者在攻读硕士学位期间发表的论文目录
独创性声明
学位论文版权使用授权书
发布时间: 2006-12-05
参考文献
- [1].迪拜动漫网站web系统的设计与分析[D]. 李红松.山东大学2009
- [2].基于Web挖掘的自适应网站研究[D]. 王书舟.哈尔滨理工大学2003
- [3].基于Web的校园应用网站的设计与实现[D]. 严进.湖南大学2015
- [4].基于Web的网站组织规划与开发[D]. 罗春水.黑龙江大学2002
- [5].基于用户体验的Web设计研究[D]. 赵培慧.北方工业大学2017
- [6].基于网站指纹的web识别和混淆技术研究[D]. 王文武.武汉大学2017
- [7].Web数据挖掘在个性化自适应网站中的应用[D]. 庄玲盈.重庆大学2006
- [8].Web环境下基于页面结构的关联图像抽取的研究[D]. 李金生.东北大学2010
- [9].Web搜索引擎及优化的研究与应用[D]. 梁宏倩.西安电子科技大学2010
- [10].基于WEB的校园移动教育服务的设计与实现[D]. 李龙.电子科技大学2010
相关论文
- [1].基于Web挖掘的个性化学习系统[D]. 于倩.中国石油大学2007
- [2].基于web挖掘的自适应站点研究[D]. 方成效.华东交通大学2006
- [3].分布式Web挖掘与搜索的研究与实现[D]. 姚勇.西安电子科技大学2006
- [4].基于Web挖掘的网站逻辑结构生成系统[D]. 郑皎凌.重庆大学2006
- [5].基于Web挖掘的电子商务推荐系统研究[D]. 王丛.山东科技大学2006
- [6].基于Web挖掘的信息推荐技术研究[D]. 林颖.扬州大学2006
- [7].Web数据挖掘在个性化自适应网站中的应用[D]. 庄玲盈.重庆大学2006
- [8].聚类算法在Web挖掘中的应用[D]. 范明.西北工业大学2007
- [9].基于WEB挖掘的个性化服务[D]. 陈永平.合肥工业大学2007
- [10].Web日志挖掘技术的研究与自适应Web站点的构建[D]. 凌志泉.天津大学2003