基于Web的用户访问信息挖掘研究

基于Web的用户访问信息挖掘研究

论文摘要

网络的普及,海量的Web信息为数据挖掘提供了丰富的资源,Web用户访问信息的挖掘便是基于Web研究中最广泛的一种应用。其目的是更好地理解基于Web的各种应用,以便提供优质的服务。由于其潜在的应用价值,Web访问信息挖掘在研究领域和商业领域都取得了迅速的发展。本文在介绍数据挖掘和Web挖掘的基础上,重点对Web日志挖掘进行了研究,首先介绍了Web日志的数据预处理五个基本过程,即数据清理、用户识别、会话识别、路径补充以及事务识别,并对基于cookie的用户识别技术及基于最大前向引用的事务识别方法进行了分析。其次,介绍了关联规则挖掘的相关理论和Apriori算法,分析了关联规则挖掘存在的一些不足,研究了基于兴趣度的页面关联规则挖掘,其主要是将用户兴趣度和页面关联规则相结合,并应用于个性化服务中。然后,研究了利用聚类分析实现实时个性化推荐的方法,通过聚类具有顺序访问特性的用户,并得到每一个用户类的相应的页面推荐集,利用推荐引擎对用户的当前访问进行分类,将当前用户归结到某一个聚类集中,然后在用户当前访问的页面,推荐用户所属用户类的推荐页面集。本文最后构建了一个Web日志挖掘技术在远程教育网站中的应用模式。在远程教育过程中,通过引入Web日志挖掘,不仅可以为学习者提供个性化学习,而且有利于远程教学的各种管理工作。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 课题研究背景
  • 1.2 课题研究动态和应用现状
  • 1.3 课题研究的意义
  • 1.4 论文组织结构和内容
  • 第二章 数据挖掘和Web数据挖掘
  • 2.1 数据挖掘技术
  • 2.1.1 数据挖掘的概念和结构
  • 2.1.2 数据挖掘的功能和方法
  • 2.1.3 数据挖掘的应用
  • 2.2 web数据挖掘研究
  • 2.2.1 web数据挖掘概述
  • 2.2.2 web内容挖掘
  • 2.2.3 web结构挖掘
  • 2.2.4 web访问信息挖掘
  • 第三章 Web访问信息挖掘及预处理研究
  • 3.1 数据预处理
  • 3.1.1 Web挖掘的数据源
  • 3.1.2 数据清洗
  • 3.1.3 用户识别
  • 3.1.4 会话识别
  • 3.1.5 路径补充
  • 3.1.6 事务识别
  • 3.2 模式发现
  • 3.3 模式分析
  • 第四章 页面关联规则挖掘研究
  • 4.1 关联规则挖掘
  • 4.1.1 关联规则的相关定义
  • 4.1.2 关联规则的分类
  • 4.1.3 关联规则挖掘过程
  • 4.2 Apriori算法
  • 4.3 页面关联规则挖掘
  • 4.3.1 相关理论
  • 4.3.2 基于兴趣度的页面关联规则
  • 第五章 基于Web日志挖掘的实时个性化推荐
  • 5.1 聚类分析在个性化推荐中的应用
  • 5.1.1 问题的提出和解决
  • 5.1.2 聚类方法
  • 5.2 实时个性化推荐的实现
  • 5.2.1 数据准备阶段
  • 5.2.2 挖掘阶段
  • 5.2.3 生成推荐集
  • 5.2.4 推荐引擎
  • 第六章 Web用户访问信息挖掘在远程教育系统中的应用
  • 6.1 问题的提出和解决方法
  • 6.2 基于Web挖掘的个性化远程教育系统
  • 6.2.1 系统平台设计
  • 6.2.2 系统实现过程
  • 第七章 结论与展望
  • 参考文献
  • 致谢
  • 攻读学位期间发表的学术论文
  • 相关论文文献

    • [1].多源头网络用户访问信息自适应识别算法[J]. 科学技术与工程 2019(16)
    • [2].基于手机气象客户端访问信息的自动统计[J]. 电子世界 2019(18)
    • [3].基于用户访问信息的数据挖掘方法及其算法[J]. 计算机工程与应用 2012(15)
    • [4].无线局域网攻击方法及安全研究[J]. 数字技术与应用 2010(09)
    • [5].流量的秘密——基于Piwik的网站分析[J]. 信息通信 2013(06)
    • [6].基于Highcharts的浙江天气网数据统计分析平台开发[J]. 数字技术与应用 2015(11)
    • [7].网格环境下图书馆用户访问信息资源兴趣的路径聚类研究[J]. 情报探索 2009(04)
    • [8].基于角色访问控制的约束模型研究[J]. 太原科技大学学报 2016(04)
    • [9].浅谈无线局域网的安全防范策略[J]. 西部资源 2014(03)

    标签:;  ;  ;  ;  ;  

    基于Web的用户访问信息挖掘研究
    下载Doc文档

    猜你喜欢