基于Web的用户访问信息挖掘研究

论文摘要

网络的普及,海量的Web信息为数据挖掘提供了丰富的资源,Web用户访问信息的挖掘便是基于Web研究中最广泛的一种应用。其目的是更好地理解基于Web的各种应用,以便提供优质的服务。由于其潜在的应用价值,Web访问信息挖掘在研究领域和商业领域都取得了迅速的发展。本文在介绍数据挖掘和Web挖掘的基础上,重点对Web日志挖掘进行了研究,首先介绍了Web日志的数据预处理五个基本过程,即数据清理、用户识别、会话识别、路径补充以及事务识别,并对基于cookie的用户识别技术及基于最大前向引用的事务识别方法进行了分析。其次,介绍了关联规则挖掘的相关理论和Apriori算法,分析了关联规则挖掘存在的一些不足,研究了基于兴趣度的页面关联规则挖掘,其主要是将用户兴趣度和页面关联规则相结合,并应用于个性化服务中。然后,研究了利用聚类分析实现实时个性化推荐的方法,通过聚类具有顺序访问特性的用户,并得到每一个用户类的相应的页面推荐集,利用推荐引擎对用户的当前访问进行分类,将当前用户归结到某一个聚类集中,然后在用户当前访问的页面,推荐用户所属用户类的推荐页面集。本文最后构建了一个Web日志挖掘技术在远程教育网站中的应用模式。在远程教育过程中,通过引入Web日志挖掘,不仅可以为学习者提供个性化学习,而且有利于远程教学的各种管理工作。

论文目录

摘要

Abstract

第一章绪论

1.1 课题研究背景

1.2 课题研究动态和应用现状

1.3 课题研究的意义

1.4 论文组织结构和内容

第二章数据挖掘和Web数据挖掘

2.1 数据挖掘技术

2.1.1 数据挖掘的概念和结构

2.1.2 数据挖掘的功能和方法

2.1.3 数据挖掘的应用

2.2 web数据挖掘研究

2.2.1 web数据挖掘概述

2.2.2 web内容挖掘

2.2.3 web结构挖掘

2.2.4 web访问信息挖掘

第三章 Web访问信息挖掘及预处理研究

3.1 数据预处理

3.1.1 Web挖掘的数据源

3.1.2 数据清洗

3.1.3 用户识别

3.1.4 会话识别

3.1.5 路径补充

3.1.6 事务识别

3.2 模式发现

3.3 模式分析

第四章页面关联规则挖掘研究

4.1 关联规则挖掘

4.1.1 关联规则的相关定义

4.1.2 关联规则的分类

4.1.3 关联规则挖掘过程

4.2 Apriori算法

4.3 页面关联规则挖掘

4.3.1 相关理论

4.3.2 基于兴趣度的页面关联规则

第五章基于Web日志挖掘的实时个性化推荐

5.1 聚类分析在个性化推荐中的应用

5.1.1 问题的提出和解决

5.1.2 聚类方法

5.2 实时个性化推荐的实现

5.2.1 数据准备阶段

5.2.2 挖掘阶段

5.2.3 生成推荐集

5.2.4 推荐引擎

第六章 Web用户访问信息挖掘在远程教育系统中的应用

6.1 问题的提出和解决方法

6.2 基于Web挖掘的个性化远程教育系统

6.2.1 系统平台设计

6.2.2 系统实现过程

第七章结论与展望

参考文献

致谢

攻读学位期间发表的学术论文

基于Web的用户访问信息挖掘研究

论文摘要

论文目录

相关论文文献

猜你喜欢