基于关联规则的Web日志挖掘研究及在电子政务中的应用

基于关联规则的Web日志挖掘研究及在电子政务中的应用

论文摘要

Web日志记录了用户对Web站点访问信息,保存有大量的路径信息,对这类信息的分析有利于网站设计人员掌握用户的喜好和访问习惯,并可以为网站的结构优化和页面重组提供帮助。日志数据的分析可以通过统计数据的形式,比如统计经常被访问的页面集、统计经常需要分析的重要表格数据、分析网站找出一般的访问路径模式等。Web日志挖掘就是运用数据挖掘的思想来对服务器日志进行分析处理,从而解决上面提出的各种问题。本文首先对Web数据挖掘和web日志挖掘进行了研究,指出了其具体内容和二者的关系,同时对Web日志的预处理进行了分析研究,描述了面向电子政务的点击流数据预处理方法,设计了相关的数据库表和实施预处理的流程算法。通过对经典FP-growth算法进行分析,提出了FP-growth关联规则挖掘的改进算法,通过性能比较,指出改进算法的性能在时间上得到了提高。论文进一步讨论了在原有先锋电子政务系统的基础上,将数据挖掘中关联规则FP-growth的改进挖掘算法应用到电子政务Web日志挖掘系统中。经过对关联规则算法的研究和改进,采用了改进的FP-growth算法对经过数据预处理的点击流数据进行了挖掘,并分析挖掘结果,指出网站结构的不足,从而对网站结构建设及政务系统的改进提出意见。在论文总结展望部分,讨论了目前研究工作中需要进一步完善的问题,指出了今后的研究方向。

论文目录

  • 摘要
  • ABSTRACT
  • 目录
  • 第1章 绪论
  • 1.1 研究背景和意义
  • 1.1.1 研究背景
  • 1.1.2 理论及实际意义
  • 1.2 Web日志挖掘的现状
  • 1.3 本文研究的主要内容
  • 1.4 本文的章节结构
  • 第2章 点击流综述
  • 2.1 什么是点击流
  • 2.2 Web服务器日志
  • 2.3 本章小结
  • 第3章 WEB数据挖掘与 WEB日志挖掘
  • 3.1 数据挖掘概述
  • 3.2 Web数据挖掘
  • 3.2.1 Web数据挖掘的定义
  • 3.2.2 Web数据挖掘的分类
  • 3.2.3 Web数据挖掘的对象
  • 3.2.4 Web数据的特点
  • 3.3 Web日志挖掘
  • 3.3.1 Web日志挖掘的定义
  • 3.3.2 Web日志挖掘的应用领域
  • 3.3.3 Web日志挖掘的过程
  • 3.4 本章小结
  • 第4章 点击流数据的预处理
  • 4.1 点击流数据预处理概述
  • 4.1.1 点击流分析中的相关名词术语
  • 4.1.2 数据预处理的必要性
  • 4.1.3 点击流数据预处理的一般过程
  • 4.2 面向电子政务的预处理方法设计
  • 4.2.1 数据库设计
  • 4.2.2 实时预处理的流程算法
  • 4.3 政府网站日志预处理方法
  • 4.4 本章小结
  • 第5章 FP-GROWTH关联规则算法及改进
  • 5.1 关联规则的概念
  • 5.1.1 基本概念及问题描述
  • 5.1.2 Apriori算法及分析
  • 5.2 FP-Growth挖掘算法及其相关性质
  • 5.2.1 FP-Growth算法的提出
  • 5.2.2 FP-growth算法描述及示例
  • 5.3 FP-growth改进算法的提出
  • 5.3.1 FP-tree算法的优点
  • 5.3.2 FP-growth算法的缺点
  • 5.4 FP-growth改进算法的设计与实现
  • 5.5 FP-growth改进算法应用实例
  • 5.6 FP-growth改进算法与原算法性能比较
  • 5.6.1 实验的环境及数据
  • 5.6.2 实验结果
  • 5.7 本章小结
  • 第6章 WEB日志挖掘在电子政务中的应用
  • 6.1 电子政务平台简介
  • 6.2 本人在平台上的工作
  • 6.3 日志挖掘系统的体系结构
  • 6.4 用户功能模块设计及分析
  • 6.4.1 预处理模块
  • 6.4.2 基本分析模块
  • 6.4.3 智能分析模块
  • 6.5 用改进算法对网站日志进行挖掘
  • 6.5.1 挖掘结果的表达和分析
  • 6.6 发现的问题和网站结构建议
  • 6.7 本章小结
  • 第7章 总结与展望
  • 参考文献
  • 攻读学位期间的科研成果
  • 致谢
  • 相关论文文献

    • [1].基于WEB的通信电源远程监控系统研究[J]. 中国设备工程 2019(24)
    • [2].基于自适应遗传算法的考虑服务质量感知Web服务发现[J]. 电子测量技术 2019(22)
    • [3].面向Web系统热点数据预测及缓存管理的研究[J]. 信息技术与信息化 2019(12)
    • [4].基于页面对象的Web应用测试用例生成方法[J]. 计算机应用 2020(01)
    • [5].运用物联网和Web服务搭建院际转运信息平台[J]. 电子技术与软件工程 2020(02)
    • [6].延迟加载在web开发中的应用心得[J]. 视听 2020(02)
    • [7].基于Web的期刊采编系统的设计与实现[J]. 电脑知识与技术 2020(06)
    • [8].Web服务软件测试技术的研究与实现[J]. 电脑知识与技术 2020(02)
    • [9].移动互联网时代的Web性能优化实践[J]. 信息通信 2020(01)
    • [10].基于Web的校园个人自行车租赁系统[J]. 卫星电视与宽带多媒体 2020(02)
    • [11].基于网站制作的Web前端开发技术与优化[J]. 数字技术与应用 2020(01)
    • [12].基于Web应用的网络安全漏洞发现与研究[J]. 无线互联科技 2020(05)
    • [13].基于Web的动态几何软件领域模型及其应用[J]. 计算机应用 2020(04)
    • [14].基于web技术支持下网络多媒体课件的制作原则及优点[J]. 科技风 2020(13)
    • [15].基于Web的网上教学平台的设计与实现[J]. 科技与创新 2020(07)
    • [16].1+X证书制度与Web前端开发专业融合的探索[J]. 信息与电脑(理论版) 2020(04)
    • [17].基于《web前端页面设计》在线开放课程自主学习探讨[J]. 计算机产品与流通 2020(05)
    • [18].基于WEB的计算机课程辅助教学系统的设计与实现[J]. 计算机产品与流通 2020(05)
    • [19].基于Web的时变体数据的体绘制方法[J]. 计算机测量与控制 2020(04)
    • [20].Web浏览器中数据安全配置的研究[J]. 电脑编程技巧与维护 2020(04)
    • [21].基于实践应用的Web开发技术教学改革研究初探[J]. 科学大众(科学教育) 2020(05)
    • [22].基于Web的桥梁健康监测系统设计与实现[J]. 计算机技术与发展 2020(04)
    • [23].基于Web技术的计算机实验室综合管理系统设计[J]. 电子制作 2020(11)
    • [24].分析校园网中Web服务器的配置及安全防护[J]. 江西电力职业技术学院学报 2020(01)
    • [25].基于Web的研究生学位信息管理系统技术研究[J]. 创新创业理论研究与实践 2020(07)
    • [26].WEB技术在地质资料二次开发中的应用探讨[J]. 中国非金属矿工业导刊 2020(03)
    • [27].基于Web技术的医疗图像脱敏系统的设计与实现[J]. 宁夏工程技术 2020(02)
    • [28].网站制作的Web前端开发设计的相关研究[J]. 卫星电视与宽带多媒体 2020(07)
    • [29].Web开发提高网站性能的技巧[J]. 电脑编程技巧与维护 2020(06)
    • [30].随钻测井地质导向服务WEB版[J]. 国外测井技术 2020(03)

    标签:;  ;  ;  ;  ;  

    基于关联规则的Web日志挖掘研究及在电子政务中的应用
    下载Doc文档

    猜你喜欢