数据集成中基于本体的语义异构消除研究

数据集成中基于本体的语义异构消除研究

论文摘要

随着数据库和网络技术的飞速发展,大量的异构数据源应运而生。随着对信息综合利用需求的进一步提高,人们迫切希望解决这些异构数据源的集成问题。中间件技术的发展使得硬件平台、网络协议及操作系统的异构不再是人们关注的焦点。虽然ETL等新工具和新技术出现使得集成数据手段更加多样化,人们可以获取的数据资源日益丰富、数据量也急剧增加。但是人们逐渐意识到ETL等通用集成工具只消除了数据在语法、结构层次的异构,而缺乏有效解决语义异构的能力。传统的数据清洗技术大多也是从数据的文本取值的方面进行清洗处理,往往忽略了数据自身蕴含的语义信息,造成集成数据的质量低下。数据是信息的载体,数据价值不仅体现在数据量的积累上,更重要的是数据自身的质量。高质量的数据是各种数据分析工具(数据挖掘、OLAP等)得到有价值和有意义结果的首要条件,建立在劣质数据基础之上的决策支持系统是不可信的。数据集成中大量的劣质数据成为制约数据应用“瓶颈”。近年来数据质量问题成为人们广泛关注的焦点,如何集成高质量的数据成为当前亟待解决的问题。研究表明数据集成中的质量问题实际上主要是数据的“误理解”引起的。由于数据源的自治性、异构性与领域相关性造成了信息资源的语义异构,语义异构已经成为当前数据集成的引起数据质量问题的最大隐患。传统的数据集成方法,在数据的处理时过分依赖于数据模式提供的约束,没有考虑领域信息的语义约束,忽略了数据自身的语义信息。因此,如何在数据集成研究中引入语义特性成为提高数据质量的一个新的研究点。基于以上,本文通过基于本体的语义异构消除方法来解决数据集成中由于语义引起的数据质量问题。针对这一研究课题,文章的主要研究工作如下:首先,在信息化建设的背景下,对数据集成的目标、异构数据进行了研究,总结了数据集成的传统方法和基于本体的数据集成在国内外研究现状。其次,对数据库中的语义异构及其引起的语义冲突进行了详细的分析和探讨,对本体及相关技术的研究进行了总结,并以此作为支撑论文研究的理论基础,分析了现有数据集成研究中存在的不足,并论证了利用本体及相关技术解决语义异构问题的可行性。然后,基于领域本体能够捕捉数据库ER模型共性的特点,提出了消除示意性冲突的万法。通过形式化描述数据源概念模型中元数据的上下文环境,然后将元数据中隐藏的语义信息转化为实体的属性来解决数据库概念间的示意性冲突,实现了到目标模式的转化。在示意性冲突消除的基础上,结合本体拥有比关系模式更加强大的语义表达能力,通过扩展关系模式隐含的语义来检测数据层冲突。最后,在课题研究中的示意性冲突和数据层冲突消除方法的基础上,完成了油菜分子数据库后台数据的集成任务,有效的解决了现有数据集成中缺乏语义研究带来的数据质量问题。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 研究背景及意义
  • 1.2 研究现状
  • 1.3 存在的主要问题
  • 1.4 研究内容和目标
  • 1.5 本文结构组织
  • 第二章 数据集成
  • 2.1 数据集成的目标
  • 2.2 异构数据
  • 2.3 异构数据集成方法
  • 2.4 基于本体的数据集成
  • 2.5 本章小结
  • 第三章 本体与语义异构研究
  • 3.1 语义异构
  • 3.2 本体构建
  • 3.3 本体在语义异构消除中的作用
  • 3.4 本章小结
  • 第四章 示意性冲突消除
  • 4.1 概念语义上下文
  • 4.2 实体示意性冲突消除
  • 4.3 关系示意性冲突消除
  • 4.4 实体属性示意性冲突消除
  • 4.5 关系属性示意性冲突消除
  • 4.6 本章小结
  • 第五章 数据层冲突检测
  • 5.1 数据层冲突分类本体
  • 5.2 扩展关系模式的语义
  • 5.3 ESRS个体
  • 5.4 本章小结
  • 第六章 油菜分子数据集成中语义异构消除
  • 6.1 油菜品种分子数据库建设目标
  • 6.2 语义异构消除基础
  • 6.3 油菜品种分子数据的语义异构消除
  • 6.4 本章小结
  • 第七章 总结与展望
  • 参考文献
  • 附录
  • 致谢
  • 在读期间发表的论文及参加的科研项目
  • 相关论文文献

    • [1].《本体二》[J]. 美苑 2015(S1)
    • [2].渺茫的本体[J]. 中国诗歌 2018(03)
    • [3].虫梦[J]. 意林(少年版) 2010(08)
    • [4].基于程序语义的本体表示方法[J]. 信息系统工程 2017(08)
    • [5].本体评估方法研究综述[J]. 计算机应用研究 2015(03)
    • [6].基于测试用例的应用本体需求验证方法研究[J]. 图书与情报 2013(01)
    • [7].本体演化管理的方法和关键技术研究进展[J]. 图书情报工作 2011(14)
    • [8].工业4.0本体标准及其场景[J]. 国外社会科学前沿 2020(04)
    • [9].基于图数据库的本体查询与推理[J]. 机电产品开发与创新 2019(01)
    • [10].本体对齐技术概述及其在中医领域的应用探讨[J]. 世界科学技术-中医药现代化 2017(01)
    • [11].二人转艺术本体溯源[J]. 剧作家 2010(01)
    • [12].数据本体的概念及意义解析[J]. 岭南学刊 2020(06)
    • [13].中国哲学的“本体”概念与“本体论”[J]. 哲学研究 2010(09)
    • [14].基于群体行为的协同构建本体可信度研究[J]. 情报杂志 2015(06)
    • [15].关注语文本体 提升核心素养[J]. 小学教学参考 2018(34)
    • [16].基于本体的高校图书馆知识地图研究[J]. 图书馆学研究 2012(17)
    • [17].领域本体的构建方法研究[J]. 图书与情报 2011(01)
    • [18].基于描述逻辑的本体进化框架[J]. 计算机工程 2010(13)
    • [19].近两年来国外有关本体基本问题的主要研究述评[J]. 图书馆建设 2008(08)
    • [20].本体的追问和本体的内容[J]. 内蒙古社会科学(汉文版) 2008(05)
    • [21].回归本体 激浊扬清——书法批评的历史回顾与反思[J]. 中国书法 2019(12)
    • [22].人类本体观的历史与价值审视[J]. 阅江学刊 2019(05)
    • [23].广益[J]. 上海艺术评论 2017(03)
    • [24].本体评估研究进展[J]. 情报学报 2016(07)
    • [25].“诗意”之“静”与“美感”之“动”的辩证体现——《形上本体诗学》之“客观诗本体”诗学原理浅析[J]. 河南师范大学学报(哲学社会科学版) 2016(04)
    • [26].基于本体论的大学本体的探究[J]. 现代教育管理 2016(09)
    • [27].客体、主体与道体——论本体的形态[J]. 哲学研究 2013(04)
    • [28].生物医学本体工程进展[J]. 中国数字医学 2012(11)
    • [29].中国哲学中的本体之“诗”[J]. 西北人文科学评论 2009(00)
    • [30].本体构建研究综述[J]. 现代计算机(专业版) 2012(14)

    标签:;  ;  ;  ;  

    数据集成中基于本体的语义异构消除研究
    下载Doc文档

    猜你喜欢