论文摘要
如今很多现有的数据并不存在于数据库管理系统,它们的数据结构很多是不关联的,有时也是不规则的,例如为HTML或SGML文档,尤其是XML文件,已经逐渐发展成为一个大型的XML数据储存库。本文要研究的知识提取即在这样一个前提条件下,通过特定的工具将HTML转化为XML文档,并对其广泛的词汇表中的可选标签进行研究,结果表明本方法对于重复标签的XML文档的研究尤为有效。对于XML文档之间的相似性度量,可以采取不同的方法,或者研究其文档的结构,内容,或两者都是。文中介绍了如何将模糊理论与这种半结构化并且共享一个共同词汇标签的XML结合起来。这种做法的基本思想是采用与模糊集合相对的另一种形式模糊袋,以衡量比较,评价XML文档之间的结构相似性,然后介绍了对提取的知识如何进行有效的分类。本文首先对相关背景和技术作了一个简单的介绍,随后重点介绍如何应用模糊技术对XML文档进行结构的分析,在此基础之上结合对文档的内容分析产生更精确的分类,提出了一种更为灵活的相似度计算的方法。最后阐述基于所生成的聚类代表研究如何实现本体研究中的两个基本的抽象关系is-a和part-of,之后可以通过选择恰当的本体的描述语言OWL将所提取的类之间的关系和限制进行表述。
论文目录
相关论文文献
- [1].基于XML文件的试题文件库的设计[J]. 中国电力教育 2009(16)
- [2].基于XML的Web应用模型抽取[J]. 计算机科学 2011(09)
- [3].基于XML的信息检索研究[J]. 吉林工程技术师范学院学报 2008(11)
- [4].XML解析技术研究[J]. 福建电脑 2014(05)
- [5].基于XML的数据表示方式设计与实现[J]. 电脑编程技巧与维护 2014(10)
- [6].一种网格环境下的异构数据库转换方法[J]. 电脑开发与应用 2009(12)
- [7].一种面向XML文档的模糊关联规则算法[J]. 科学技术与工程 2011(26)
- [8].基于移动技术的学生信息系统设计与管理[J]. 考试周刊 2012(16)
- [9].VS环境下XML解析实现[J]. 电脑知识与技术 2013(23)
- [10].XML文档的DTD层次授权研究[J]. 网络安全技术与应用 2008(12)
- [11].基于DOM树实现轻量级XML文档解析[J]. 电脑编程技巧与维护 2016(18)
- [12].面向接口数据描述的XML应用研究[J]. 网络安全技术与应用 2013(11)
- [13].基于核方法的XML文档自动分类[J]. 计算机学报 2011(02)
- [14].基于压缩策略的安全XML关键字查询[J]. 计算机工程与应用 2011(36)
- [15].一种从XML数据中发现关系信息的方法[J]. 软件学报 2008(06)
- [16].Oracle XML DB和DB2 pure XML在XML文档存储查询性能方面的比较分析[J]. 计算机应用与软件 2012(05)
- [17].基于XML的银行报表系统数据转换研究[J]. 微计算机信息 2011(05)
- [18].基于路径特征的XML文档结构相似性度量[J]. 计算机应用与软件 2015(07)
- [19].概率XML文档实例生成算法研究[J]. 燕山大学学报 2013(05)
- [20].元数据管理应用系统的设计与实现[J]. 计算机工程 2009(11)
- [21].XML文档访问控制研究[J]. 计算机工程 2009(17)
- [22].一种基于YFilter的XML数据流查询的改进算法[J]. 福州大学学报(自然科学版) 2010(06)
- [23].一种基于有序对的含父子边的小枝模式匹配算法[J]. 计算机应用 2009(10)
- [24].从关系数据库到XML文档的转换[J]. 大众科技 2008(12)
- [25].一种支持更新的有序XML文档编码方法[J]. 计算机工程与应用 2012(25)
- [26].基于XML网格数据交换和存储的研究[J]. 濮阳职业技术学院学报 2009(03)
- [27].XML数据岛实现网页数据异步传输[J]. 信息通信 2013(06)
- [28].水面舰船甲板局部静强度测试软件[J]. 中国舰船研究 2012(02)
- [29].基于主题概念的XML文档关键字查询算法[J]. 华中科技大学学报(自然科学版) 2010(06)
- [30].一种快速的XML文档验证算法[J]. 计算机技术与发展 2015(08)