基于Web日志的序列模式挖掘及其在电子商务中的应用

基于Web日志的序列模式挖掘及其在电子商务中的应用

论文摘要

随着Internet技术的快速发展和普及,电子商务逐渐流行起来。电子商务系统在运行的过程中积累了大量的访问数据,对于企业来说,这些数据是十分宝贵的资源。由于数据挖掘技术致力于数据分析和理解、揭示数据内部所蕴藏的知识,因而在数据存储爆炸性增长的今天,大量潜在的有用信息得以被提取和发现。将数据挖掘技术应用于Web数据分析的Web挖掘技术成为一个重要的研究领域。Web日志挖掘是Web数据挖掘中的一种,运用数据挖掘技术对服务器日志进行分析和处理,从网站的访问日志文件中挖掘出用户的访问模式,比如关联规则、序列模式。本文对Web日志中序列模式的挖掘及其在电子商务中的应用做了研究。序列模式挖掘最早用于购物篮的分析,PrefixSpan算法是传统序列模式挖掘的一种比较有效的方法。本文所用算法主要是在PrefixSpan算法的基础上,做了一些改进,并且添加了一些规则约束,比如最大间隔约束,使其既可以应用于普通的购物篮分析,又可以应用于Web访问序列的挖掘。在Web日志挖掘中,数据的预处理尤为重要,本文首先对Web日志进行了数据预处理,包括数据清洗、用户识别、会话识别、路径补充等。另外,本文提出了一种新的Web访问序列模式挖掘方法,首先对经过预处理后的数据库进行用户的最大前向引用的识别,在此基础上运用序列模式挖掘算法进行频繁访问序列的挖掘。Web访问序列模式的挖掘具有重要的实践意义。电子商务的发展为企业提供了新的商业模式,Web访问序列模式在电子商务中,既可以用于进行站点的优化,又可以为用户提供个性化的推荐服务。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 研究背景与意义
  • 1.2 国内外研究与应用现状
  • 1.2.1 数据挖掘
  • 1.2.2 Web 挖掘
  • 1.2.3 电子商务
  • 1.3 研究内容和论文组织方式
  • 第二章 Web 日志挖掘
  • 2.1 Web 日志挖掘
  • 2.1.1 Web 日志文件
  • 2.1.2 Web 日志挖掘的过程
  • 2.2 Web 访问模式挖掘
  • 2.2.1 构造WAP-tree
  • 2.2.2 从WAP-tree 中挖掘Web 访问序列模式
  • 2.3 本章小结
  • 第三章 Web 日志挖掘的数据预处理
  • 3.1 数据清洗
  • 3.2 用户识别
  • 3.3 会话识别
  • 3.4 路径补充
  • 3.5 本章小结
  • 第四章 基于Web 日志的序列模式挖掘
  • 4.1 序列模式挖掘的相关概念
  • 4.1.1 序列模式挖掘的定义
  • 4.1.2 序列模式挖掘的特点
  • 4.2 改进的PrefixSpan 算法
  • 4.2.1 PrefixSpan 算法
  • 4.2.2 PrefixSpan 算法的改进分析
  • 4.2.3 改进的PrefixSpan 算法流程
  • 4.2.4 改进的PrefixSpan 算法示例
  • 4.2.5 性能分析
  • 4.3 基于改进PrefixSpan 算法的用户访问序列模式挖掘
  • 4.3.1 识别最大前向引用
  • 4.3.2 频繁访问序列挖掘
  • 4.4 实验及结果分析
  • 4.5 本章小结
  • 第五章 电子商务中Web 访问序列模式挖掘的应用
  • 5.1 电子商务及其现状分析
  • 5.1.1 电子商务概述
  • 5.1.2 电子商务现状分析
  • 5.2 电子商务中Web 挖掘的应用分析
  • 5.2.1 面向电子商务的数据挖掘特点
  • 5.2.2 电子商务环境下的客户关系管理需求分析
  • 5.2.3 Web 挖掘在电子商务中的应用前景
  • 5.3 Web 访问序列模式在电子商务中的应用
  • 5.3.1 优化站点
  • 5.3.2 个性化推荐
  • 5.4 本章小结
  • 第六章 结束语
  • 6.1 内容总结
  • 6.2 研究展望
  • 参考文献
  • 发表论文和参加科研情况说明
  • 致谢
  • 相关论文文献

    • [1].序列模式挖掘在心理危机干预技能评估中的应用[J]. 上海交通大学学报(医学版) 2020(03)
    • [2].序列模式中的生成序列模式挖掘综述[J]. 无线通信技术 2018(04)
    • [3].增量序列模式挖掘研究进展[J]. 网络安全技术与应用 2017(01)
    • [4].间隙约束序列模式挖掘的对比研究[J]. 网络安全技术与应用 2017(02)
    • [5].序列模式挖掘两种典型算法的研究[J]. 信息技术 2016(11)
    • [6].满足非重叠条件的带有通配符序列模式挖掘[J]. 小型微型计算机系统 2017(05)
    • [7].基于位置信息的显露序列模式挖掘研究[J]. 计算机科学 2017(07)
    • [8].序列模式挖掘在教学管理上的运用[J]. 电脑知识与技术 2016(13)
    • [9].负序列模式挖掘研究[J]. 廊坊师范学院学报(自然科学版) 2015(03)
    • [10].序列模式挖掘技术在数字图书馆中的应用[J]. 农业图书情报学刊 2015(07)
    • [11].一种最有趣的序列模式挖掘算法[J]. 计算机仿真 2019(04)
    • [12].考虑价格的跨种类模糊序列模式挖掘算法[J]. 计算机应用研究 2018(01)
    • [13].水质时间序列模式挖掘[J]. 计算机技术与发展 2018(05)
    • [14].基于频繁序列模式挖掘的反恐情报关联分析[J]. 情报理论与实践 2018(10)
    • [15].序列模式挖掘在通信网络告警预测中的应用[J]. 计算机科学 2018(S2)
    • [16].闭合负序列模式挖掘[J]. 哈尔滨师范大学自然科学学报 2015(06)
    • [17].多维序列模式挖掘算法分析[J]. 赤峰学院学报(自然科学版) 2014(07)
    • [18].基于序列模式挖掘的读者借阅行为分析[J]. 图书情报知识 2011(04)
    • [19].序列模式挖掘综述[J]. 计算机应用研究 2008(07)
    • [20].多支持度下用户行为序列模式挖掘方法研究[J]. 计算机应用与软件 2018(01)
    • [21].基于隐私保护的序列模式挖掘[J]. 计算机科学 2016(12)
    • [22].基于支持量的并发序列模式挖掘方法[J]. 计算机工程与设计 2016(01)
    • [23].基于序列模式挖掘的基因剪接位点[J]. 数据采集与处理 2016(05)
    • [24].一种基于逻辑的频繁序列模式挖掘算法[J]. 计算机科学 2015(05)
    • [25].高效的稀有序列模式挖掘方法[J]. 计算机科学与探索 2015(04)
    • [26].时态数据中序列模式挖掘研究[J]. 科技创新导报 2014(13)
    • [27].序列模式挖掘在教学管理上的应用[J]. 计算机与现代化 2012(11)
    • [28].一种模糊序列模式挖掘的有效方法[J]. 现代计算机(专业版) 2010(13)
    • [29].并发序列模式挖掘方法研究[J]. 计算机应用 2009(11)
    • [30].序列模式挖掘算法在高血压治疗中的研究[J]. 计算机工程与设计 2018(03)

    标签:;  ;  ;  ;  ;  

    基于Web日志的序列模式挖掘及其在电子商务中的应用
    下载Doc文档

    猜你喜欢