Web数据挖掘中XML应用及关联算法改进

Web数据挖掘中XML应用及关联算法改进

论文摘要

面向web的数据挖掘是一项复杂的技术,Web数据挖掘就是利用数据挖掘技术从网络文档和服务中发现和提取信息。Web上的信息五花八门,传统的Internet由各种类型的服务和数据源组成,包括WWW、FTP、Telnet等,现在有更多的数据和端口可以使用,比如政府信息服务、数字图书馆、电子商务数据,以及其他各种通过Web可以访问的数据库。Web上各种形式的文档和用户访问信息就构成了Web数据挖掘的对象。根据挖掘对象的不同,我们将Web数据挖掘分为三类:Web内容挖掘、Web结构挖掘、Web用法挖掘。由于XML能够使不同来源的结构化的数据很容易地结合在一起,因而使搜索多样的不兼容的数据库能够成为可能,从而为解决数据挖掘难题带来了希望。Apriori算法在关联规则领域有很大的影响力,然而由于需要过于频繁的扫描数据库及较大的空间消耗,仍然有需要改进的地方。通过对Apriori算法进行深入研究,本文提出了一种Apriori改进算法,通过比较分析,获得了较好的效率和性能。本文完成的主要工作如下:(1)完成了对基于XML的Web数据挖掘的技术研究。本文通过对XML这种近几年出现的具有很大潜力的Internet数据交换技术的研究分析,提出了基于XML的Web挖掘的新思路,并且完成了对XML的Web挖掘系统的系统功能设计。(2)实现了XML到数据库模式的转化工具。本文主要针对XML的DTD文档,提出了一系列从XML到关系数据库模式的转换算法,从而也就把基于XML的Web数据挖掘与传统的基于关系数据模式的数据挖掘算法建立了联系。(3)对Apriori算法进行深入分析,并提出了一种优化算法。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 研究背景
  • 1.2 课题研究状况
  • 1.2.1 数据挖掘技术的研究发展状况
  • 1.2.2 Web数据挖掘现状及发展
  • 1.2.3 XML技术的研究发展状况
  • 1.2.4 采用XML的Web数据挖掘的研究发展状况
  • 1.3 论文组织结构
  • 第二章 数据挖掘技术及XML概述
  • 2.1 数据挖掘技术
  • 2.1.1 数据挖掘的基本概念
  • 2.1.2 数据挖掘的任务
  • 2.1.3 各种分析方法的简介
  • 2.1.4 数据挖掘的流程
  • 2.1.5 数据挖掘技术实现
  • 2.2 XML技术概述
  • 2.2.1 XML的基本内容
  • 2.2.2 XML的特点和应用范围
  • 2.2.3 XML与其他文档和数据模型的区别
  • 2.2.4 XML数据处理
  • 2.2.5 DOM简介
  • 第三章 WEB数据挖掘的技术和原理
  • 3.1 Web数据挖掘技术概述
  • 3.2 Web内容挖掘(Web Content Mining)
  • 3.2.1 Web内容挖掘两个不同的研究观点
  • 3.2.2 Web文本挖掘概念及相关技术
  • 3.2.3 Web多媒体挖掘
  • 3.2.4 特征提取
  • 3.2.5 文本分类方法
  • 3.2.6 网页分类方法
  • 3.3 Web结构挖掘
  • 3.4 Web用法挖掘(Web usage Mining)
  • 第四章 基于XML的WEB数据挖掘技术
  • 4.1 面向Web的数据挖掘面临的挑战
  • 4.2 XML作为数据交换格式的主要特点
  • 4.3 XML在Web数据挖掘中的应用
  • 第五章 系统实现与APRIORI算法优化
  • 5.1 系统分析与实现
  • 5.1.1 源数据收集(Data Gathering)
  • 5.1.2 数据预处理(Data Preprocessing)
  • 5.1.3 模式发现(Pattern Discovery)
  • 5.1.4 模式分析(Pattern Analysis)
  • 5.2 Web数据映射到关系数据库的方法改进
  • 5.2.1 XML数据的生成
  • 5.2.2 将XML文档内容映射到关系数据库
  • 5.3 Apriori算法及改进
  • 5.3.1 Apriori算法描述
  • 5.3.2 Apriori算法改进思路
  • 5.3.3 Apriori改进算法基本思想
  • 5.4 算法改进实验结果及分析
  • 第六章 结束语
  • 参考文献
  • 致谢
  • 学位论文评阅及答辩情况表
  • 相关论文文献

    • [1].浅析大数据挖掘中抽样估计法的应用[J]. 现代信息科技 2019(21)
    • [2].基于大数据挖掘的广播电视客户价值分析[J]. 科技视界 2019(34)
    • [3].基于深度学习的工业领域数据挖掘方法及应用[J]. 数字技术与应用 2019(11)
    • [4].基于大数据思维的财务数据挖掘及应用研究[J]. 国际商务财会 2019(11)
    • [5].第16届高级数据挖掘和应用国际会议[J]. 软件工程 2020(04)
    • [6].基于云计算的大数据挖掘体系构建分析[J]. 中外企业家 2020(11)
    • [7].测绘地理信息专业背景下的《时空数据挖掘》课程设计[J]. 南宁师范大学学报(自然科学版) 2020(01)
    • [8].智慧医疗下云数据挖掘在精细化医疗管理中的应用[J]. 中医药管理杂志 2020(03)
    • [9].高校管理人员教育数据挖掘能力培养的实践价值与实施路径[J]. 中国教育信息化 2020(07)
    • [10].大数据环境下的数据挖掘课程教学探索[J]. 中国新通信 2020(06)
    • [11].第16届高级数据挖掘和应用国际会议[J]. 软件工程 2020(05)
    • [12].基于云计算的大数据挖掘内涵及解决方案研究[J]. 数字通信世界 2020(03)
    • [13].基于可拓数据挖掘的建筑立面设计方法研究[J]. 科技传播 2020(08)
    • [14].数据挖掘实践教学环节探索[J]. 科技经济导刊 2020(11)
    • [15].大数据挖掘与云服务模式的构建[J]. 江西电力职业技术学院学报 2020(01)
    • [16].医疗云存储下医院信息数据挖掘及实现技术的探索[J]. 信息与电脑(理论版) 2020(05)
    • [17].高校治理视阈下教育数据挖掘的应用与挑战[J]. 高教论坛 2020(04)
    • [18].大数据挖掘与分析的关键技术研究[J]. 中国新通信 2020(08)
    • [19].浅析数据挖掘[J]. 内江科技 2020(06)
    • [20].教育数据挖掘关键技术应用研究[J]. 轻纺工业与技术 2020(06)
    • [21].物联网海上舰船航行数据挖掘方法[J]. 舰船科学技术 2020(12)
    • [22].云环境中大数据挖掘的有效花费研究[J]. 上海理工大学学报 2020(03)
    • [23].对《零售数据挖掘与应用》课程教学的思考[J]. 知识经济 2020(18)
    • [24].教育数据挖掘和学习分析研究进展[J]. 牡丹江师范学院学报(自然科学版) 2020(03)
    • [25].第16届高级数据挖掘和应用国际会议[J]. 软件工程 2020(08)
    • [26].电商市场中大数据挖掘的分析以及决策探究[J]. 中国新通信 2020(12)
    • [27].关于大数据挖掘中的数据分类算法技术的研究[J]. 电脑知识与技术 2020(20)
    • [28].长输油气管道大数据挖掘与应用[J]. 物联网学报 2020(03)
    • [29].数据挖掘实践课程教学模式的探索[J]. 教育教学论坛 2020(36)
    • [30].第16届高级数据挖掘和应用国际会议[J]. 软件工程 2020(10)

    标签:;  ;  ;  ;  

    Web数据挖掘中XML应用及关联算法改进
    下载Doc文档

    猜你喜欢