论文摘要
网络的普及,海量的Web信息为数据挖掘提供了丰富的资源,Web用户访问信息的挖掘便是基于Web研究中最广泛的一种应用。其目的是更好地理解基于Web的各种应用,以便提供优质的服务。由于其潜在的应用价值,Web访问信息挖掘在研究领域和商业领域都取得了迅速的发展。本文在介绍数据挖掘和Web挖掘的基础上,重点对Web日志挖掘进行了研究,首先介绍了Web日志的数据预处理五个基本过程,即数据清理、用户识别、会话识别、路径补充以及事务识别,并对基于cookie的用户识别技术及基于最大前向引用的事务识别方法进行了分析。其次,介绍了关联规则挖掘的相关理论和Apriori算法,分析了关联规则挖掘存在的一些不足,研究了基于兴趣度的页面关联规则挖掘,其主要是将用户兴趣度和页面关联规则相结合,并应用于个性化服务中。然后,研究了利用聚类分析实现实时个性化推荐的方法,通过聚类具有顺序访问特性的用户,并得到每一个用户类的相应的页面推荐集,利用推荐引擎对用户的当前访问进行分类,将当前用户归结到某一个聚类集中,然后在用户当前访问的页面,推荐用户所属用户类的推荐页面集。本文最后构建了一个Web日志挖掘技术在远程教育网站中的应用模式。在远程教育过程中,通过引入Web日志挖掘,不仅可以为学习者提供个性化学习,而且有利于远程教学的各种管理工作。
论文目录
相关论文文献
- [1].多源头网络用户访问信息自适应识别算法[J]. 科学技术与工程 2019(16)
- [2].基于手机气象客户端访问信息的自动统计[J]. 电子世界 2019(18)
- [3].基于用户访问信息的数据挖掘方法及其算法[J]. 计算机工程与应用 2012(15)
- [4].无线局域网攻击方法及安全研究[J]. 数字技术与应用 2010(09)
- [5].流量的秘密——基于Piwik的网站分析[J]. 信息通信 2013(06)
- [6].基于Highcharts的浙江天气网数据统计分析平台开发[J]. 数字技术与应用 2015(11)
- [7].网格环境下图书馆用户访问信息资源兴趣的路径聚类研究[J]. 情报探索 2009(04)
- [8].基于角色访问控制的约束模型研究[J]. 太原科技大学学报 2016(04)
- [9].浅谈无线局域网的安全防范策略[J]. 西部资源 2014(03)