论文摘要
随着海量XML数据的涌现与传递,XML已成为互联网上信息表示和数据交换的一个重要标准,继而产生了对XML数据管理的需求,如何有效地表示、查询与挖掘这些XML数据已经成为当前XML数据管理领域遇到的一个重要挑战。针对目前XML数据管理研究现状中存在的问题与不足,本文研究了XML数据模型、群体智能、模式识别、神经网络、数据挖掘与智能计算等原理与方法,在原型系统XBASE上提出了一系列基于XML键的数据清洗、查询、数据挖掘等新的智能管理方法,同时探讨了XML重构的有效途径等问题。本文围绕XML数据的查询与数据挖掘等智能管理问题展开研究,研究内容和取得的成果主要体现在以下四方面:1.XML数据管理框架—XPDM的建立现有的XML数据模型存在着四个问题影响了XML数据的有效管理,即:(1)数据的异构:给多数据源集成带来许多困难,影响了信息查询的有效性;(2)数据的非一致性:由于数据约束的不完整性,常导致数据前后不一致,影响数据查询的准确性;(3)多数据源之间数据依赖关系的不确定性:影响数据之间的归并与查询;(4)语义标准的规范:由于XML正处于发展之中,许多规范还不完善,往往导致了查询语句的繁琐与混乱。针对以上问题,本文提出了一种以XML键构建的向量空间模型为基础、利用概率理论进行操作的海量XML数据管理框架—XPDM。该框架通过对XQuery 1.0和XPath 2.0数据模型XDM进行语义规范新扩充及XML数据矢量转换,较好地解决了以上四个问题。2.数据智能清洗与查询策略为了解决XML文档中的“脏数据”问题,通过引入XML键组合及XML向量模型,利用贝叶斯学习方法与马尔可夫链概率转移策略建立XML数据清洗过程的元数据模型,利用XML树相似性判定算法,提出了一种智能清洗XML数据的新方法,通过相应规则库的预定义完成XML数据的清洗;另外为了解决XML数据清洗检测繁锁及灵活性差的问题,提出了通过合理组合XML键、融入粒子群算法、结合隐马尔可夫模型信息抽取策略构建XML数据清洗优化算法;为了提高XML数据查询的智能性与有效性,通过采用启发式方法,结合XML半结构化的特点,将粒子算法与蚁群算法融入到海量XML数据概率查询上,并进行相应改进,实现了数据查询范围的并行处理能力与收敛效率的提高。3.XML数据智能挖掘策略互联网上已聚集了海量的XML数据,为了有效地对XML数据进行挖掘,本文从以下几个方面进行研究:(1)为了提高海量XML文档集的聚类质量,分别以粒子群算法与矩阵迭代自组织算法为基础,提出了基于粒子群的XML自适应混沌聚类算法和基于向量空间模型的矩阵迭代自组织XML辅助聚类算法;(2)为了提高海量XML文档集的并行处理能力,根据混沌原理,融入蚁群聚类算法,通过定义相应混沌适应度函数衡量蚂蚁与其邻域的相似程度,提出了一种基于混沌原理与蚁群聚类模型的XML分片算法;(3)针对XML数据的流动性和无限性等特点及质量检测存在的不足,提出构建XML键的矢量矩阵作为窗口,利用矢量积小波变换多级分解与重构,再结合最小二乘支持向量机构建双滑动窗口进行XML数据自适应监测算法,满足对XML数据进行网络传递的质量管理要求。4.XML智能重构策略为了更好地优化XML的语义规范,解决随着用户需求的变化以及时间的推移、XML数据结构也会发生变化这一问题,对XML重构进行了探测性研究。在XML文档片段重构的基础上,利用XML语义约束关系及XML路径层次性,再结合向量机原理与频繁模式的特点,提出了XML频繁模式树XFP-tree算法进行XML结构重构策略,有助于进一步保证XML的质量。
论文目录
相关论文文献
- [1].基于XML的异构数据库信息交互机制的实现[J]. 物联网技术 2019(12)
- [2].新闻评论类公众号XML内容分发的发展策略研究——基于十家新闻评论微信公众号的实证考察[J]. 出版广角 2020(10)
- [3].基于FLASH与XML的在线考试系统的设计与实现[J]. 软件导刊(教育技术) 2016(12)
- [4].密码协议XML描述方法研究[J]. 信息工程大学学报 2016(06)
- [5].XML在信息系统中的应用[J]. 电脑编程技巧与维护 2017(04)
- [6].基于XML的数据中心网络统一配置方法[J]. 自动化与仪器仪表 2017(02)
- [7].基于伪反馈的有效XML查询扩展[J]. 计算机科学与探索 2016(12)
- [8].基于XML的电子病历隐私数据脱敏技术的研究与设计[J]. 信息技术与信息化 2017(03)
- [9].基于XML的电子书自排版系统的实现[J]. 出版科学 2017(04)
- [10].基于XML配置管理的数字多用表检定软件设计与实现[J]. 中国管理信息化 2017(08)
- [11].基于XML地图符号表达的研究[J]. 测绘标准化 2016(02)
- [12].XML技术在社区医疗服务系统中的应用与研究[J]. 数字技术与应用 2016(08)
- [13].基于XML的工作流引擎的设计与实现[J]. 科技风 2014(17)
- [14].关系模式到XML模式映射模型的建立与实现[J]. 电子制作 2014(20)
- [15].基于推理树的XML推理控制研究[J]. 通信技术 2015(02)
- [16].基于XML的工作流模型挖掘[J]. 计算机光盘软件与应用 2014(21)
- [17].基于XML路径表达式优化及其查询和过滤计算方法研究[J]. 信阳师范学院学报(自然科学版) 2015(04)
- [18].基于XML的公交查询系统设计[J]. 科教文汇(下旬刊) 2012(07)
- [19].XML技术的房地产估价数据标准研究[J]. 中国房地产 2013(24)
- [20].《XML技术》线上教学的实践和探索[J]. 科技风 2020(33)
- [21].探究XML在影视后期剪辑中的应用[J]. 中国传媒科技 2020(02)
- [22].基于模型检查的XML树模式优化动作生成[J]. 计算机应用与软件 2017(03)
- [23].XML与关系数据库之间的转换[J]. 教育教学论坛 2017(18)
- [24].XML中基于聚类的相似度改进算法[J]. 计算机与数字工程 2015(12)
- [25].以目标节点为导向的XML关键词查询和排序[J]. 计算机应用与软件 2016(04)
- [26].一种基于XML的工作流引擎设计和实现[J]. 电脑编程技巧与维护 2016(16)
- [27].建设基于XML技术电子病历系统的核心价值[J]. 中国数字医学 2009(02)
- [28].基于XML的结构化电子病历临床诊疗数据库构建[J]. 中国数字医学 2012(05)
- [29].基于XML的名老中医医案结构化标引系统[J]. 中国数字医学 2013(07)
- [30].基于XML-关系映射数据访问层的设计与实现[J]. 安徽广播电视大学学报 2015(02)