基于WEB挖掘的网站结构优化研究

基于WEB挖掘的网站结构优化研究

论文摘要

随着互联网的发展,越来越多的业务在互联网上开展,企业关注的重点在于用户使用Web的规律。而信息的爆炸式增长与人们注意力的有限性之间的矛盾也随之增加。Web使用挖掘正是解决这一矛盾的有效手段,它从用户对Web的访问信息中抽取出感兴趣的模式,以了解用户访问站点的访问兴趣和模式,为网站管理员提供可以带来经济效益的信息和各种利于网站结构优化的信息,用于提高网站访问效率,完善对网站的运营管理,具有十分重要的意义和广阔的前景。本文首先阐述本篇论文的研究背景及数据挖掘的国内外研究现状,并对Web日志挖掘、Web数据挖掘和数据挖掘进行了介绍,主要研究Web使用挖掘有关的理论和技术,并重点研究了关联规则的挖掘算法和最大频繁访问模式的挖掘算法。本文主要取得了以下研究成果:1.将Web日志数据、页面内容及网站结构信息都作为数据源,进行数据预处理,克服传统数据挖掘中的数据源单一问题,以提高用户访问模式识别的精确度;2.根据页面相关和客户相似的特点,将网站页面和客户群体分别进行分析,并根据站点结构信息计算页面的相对权重,作为页面排序的重要依据。根据页面分析结果,建立网站的有效索引页面,使用户进行更有效的访问;根据客户群体特性,可以进行有效的访问推荐,优化网络性能。3.克服现有关联规则的挖掘算法和最大频繁访问模式的挖掘算法的缺点,提出改进的FP-Tree算法FP-Apriori,得到用户的频繁访问模式,根据频繁模式集优化网站结构,使用户的有效访问率提高,改善网站质量;4.本文编程实现上述算法,并开发了Web网站优化系统,提出了基于WEB挖掘的网站结构优化方案,网站进行结构调整的方法,并将改进前后的网站结构的访问效率进行比较,得到了可行性验证。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 WEB 挖掘技术的发展概况及现状
  • 1.1.1 WEB 挖掘技术的类型
  • 1.1.2 WEB 挖掘技术的研究方法和现状
  • 1.1.3 WEB 挖掘技术的研究热点
  • 1.2 论文的主要工作
  • 1.3 章节安排
  • 第二章 Web 用户访问模式挖掘技术
  • 2.1 数据挖掘及WEB 挖掘
  • 2.2 WEB 挖掘的特点
  • 2.3 WEB 挖掘的类型
  • 2.3.1 WEB 使用挖掘
  • 2.3.2 WEB 使用挖掘的用途
  • 2.3.3 WEB 使用挖掘的过程
  • 2.4 本章小结
  • 第三章 Web 数据预处理技术研究
  • 3.1 WEB 使用挖掘的预处理技术
  • 3.1.1 数据清理(DATA CLEANING)
  • 3.1.2 用户识别(USER IDENTIFICATION)
  • 3.1.3 会话识别(SESSION IDENTIFICATION)
  • 3.1.4 路径补充(PATH COMPLETION)
  • 3.1.5 事务识别
  • 3.2 基于时间和链接关系的预处理算法
  • 3.3 本章小结
  • 第四章 Web 用户访问模式挖掘算法研究
  • 4.1 关联规则
  • 4.1.1 模式发现
  • 4.1.2 关联规则
  • 4.2 经典的关联规则挖掘算法分析
  • 4.2.1 APRIORI 算法基本思想与算法分析
  • 4.2.2 DHP 算法
  • 4.2.3 FP-GROWTH 算法
  • 4.3 基于FP-GROWTH 的改进算法FP-APRIORI
  • 4.3.1 FP-APRIORI 快速算法的思想
  • 4.3.2 FP-APRIORI 算法的实现
  • 4.3.3 FP-APRIORI 算法的特点
  • 4.4 本章小结
  • 第五章 改进的Web 挖掘算法在系统中的应用
  • 5.1 WEBLOG-MINING 的系统框架和功能
  • 5.2 WEBLOG-MINING 原型系统的实现与运行结果
  • 5.2.1 日志收集
  • 5.2.2 数据预处理
  • 5.2.3 FP-APRIORI 快速算法的在系统中实验
  • 5.3 网站结构优化建议
  • 5.4 本章小结
  • 第六章 结论
  • 致谢
  • 参考文献
  • 相关论文文献

    • [1].基于用户行为分析的网站结构优化研究综述[J]. 计算机科学 2016(S1)
    • [2].《我的网站我设计》微课程教学设计[J]. 中国信息技术教育 2017(Z1)
    • [3].网站结构规划探讨[J]. 东方企业文化 2013(04)
    • [4].谈网站结构优化技术研究进展[J]. 东方企业文化 2010(03)
    • [5].基于隐马尔可夫模型的电子商务网站结构优化[J]. 计算机应用研究 2009(03)
    • [6].网站结构优化方案的设计与实现[J]. 现代计算机(专业版) 2017(20)
    • [7].labthink兰光全新网站上线[J]. 中国包装 2011(03)
    • [8].我国健康保健类网站综合影响力评价研究[J]. 医学信息学杂志 2019(06)
    • [9].B2C电子商务网站结构优化的综合决策支持系统研究[J]. 科技经济导刊 2016(13)
    • [10].企业站长在优化网站内容时也别忘记结构和页面[J]. 计算机与网络 2013(21)
    • [11].网站建设过程中搜索引擎的优化与应用[J]. 电子技术与软件工程 2014(18)
    • [12].网站建设与规划的探讨[J]. 电脑知识与技术 2008(27)
    • [13].一种以主题词为特征的排序划界网站聚类算法[J]. 西安工业大学学报 2018(03)
    • [14].基于网站结构和内容的Web Server加速技术研究[J]. 福建电脑 2009(07)
    • [15].一种Deep Web聚焦爬虫[J]. 电脑与电信 2011(03)
    • [16].浅析对手网站SEO优化策略[J]. 计算机产品与流通 2017(08)
    • [17].正则表达式在数据抓取中的应用研究[J]. 佳木斯职业学院学报 2017(04)
    • [18].精品课程网站和课程中心的比较研究[J]. 中国高等医学教育 2009(11)
    • [19].网络,拉近彼此距离——光威集团网站改版开放扩容[J]. 钓鱼 2010(18)
    • [20].如何设计、优化商务网站的结构[J]. 电子商务 2013(05)
    • [21].试论网站设计中的风格和技巧[J]. 山西广播电视大学学报 2009(02)
    • [22].基于AngularJS的校友会网站的设计与实现[J]. 办公自动化 2018(24)
    • [23].微博在电子商务专业中的应用[J]. 合作经济与科技 2011(23)
    • [24].ASP.NET 2.0导航控件的用法[J]. 黑龙江科技信息 2010(34)
    • [25].搜索引擎优化(SEO)技术探讨[J]. 软件导刊 2009(08)
    • [26].基于文本计算和链接分析的主题导航优化——以ERS网站为例[J]. 情报学报 2015(09)
    • [27].基于因特网的上市公司投资者关系管理[J]. 南京财经大学学报 2008(01)
    • [28].Flash个人网站的设计与开发[J]. 职业 2011(36)
    • [29].网站结构优化模型及算法分析[J]. 计算机工程与设计 2008(21)
    • [30].网络媒体在招生宣传中的应用[J]. 湖北三峡职业技术学院学报 2013(01)

    标签:;  ;  ;  

    基于WEB挖掘的网站结构优化研究
    下载Doc文档

    猜你喜欢