中文信息的语义数据挖掘技术研究

中文信息的语义数据挖掘技术研究

论文摘要

传统的信息由于缺乏统一的语义描述,充斥着大量繁杂重复信息,面对这些海量信息,如何快速、有效地从“信息海洋”中获取人们所需的信息成为难题。让信息具有语义,使计算机能够理解信息含义,进而对信息进行加工处理,能从根本上解决这一难题,更好地实现信息共享。由于中文信息的特殊性和复杂性,使得中文信息处理难度相对较大,而信息语义化的要求则对中文信息处理提出了更高要求。用户不再仅仅满足获取直接信息,而需要获得更多的隐含语义信息,数据挖掘正是为了满足这一需求诞生的。但传统的数据挖掘需要领域专家协助,并依靠数据驱动,逐渐不能满足用户的需求。而本体作为客观知识的语义形式化描述,在数据挖掘中引入基于本体的语义分析技术,有助于解决信息处理的语义化问题,为实现中文信息语义挖掘做出贡献。论文结合信息产业部电子产业发展基金项目的开发,对中文信息的语义数据挖掘技术进行了系统的研究。首先分析了中文信息处理的特点及各项关键技术,并对中文分词技术进行了深入探讨,实现了一种采用正向最大匹配和词典分词算法的中文分词器。然后在深入介绍了本体论相关知识之后,提出了一种基于本体的语义数据挖掘(OSDM)技术,给出了其工作流程和原理,并对涉及的领域本体构建、语义标注和语义推理等关键技术进行了分析研究,给出了切实可行的解决方案,为语义数据挖掘技术的应用奠定了良好的基础。最后基于OSDM技术模型设计并实现了一个中文信息语义检索系统。该系统以参考背景知识自行构建的MyFruitOnto领域本体作为知识库,利用本体描述语言OWL的语义推理能力,对检索词进行推理扩展,来获得更准确的用户意图,返回更准确的检索结果信息。同时,系统为了克服领域局限性,系统还实现了全文检索功能,提供了更好的用户体验、更完整的功能和更可靠的系统性能,初步实现了信息检索智能化。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 研究背景和现状
  • 1.1.1 语义万维网的提出
  • 1.1.2 中文信息处理的迫切性
  • 1.1.3 数据挖掘和信息检索的新发展
  • 1.2 研究目的和意义
  • 1.3 课题来源及研究内容
  • 1.4 本文的章节安排
  • 第2章 中文信息处理技术
  • 2.1 中文信息处理概述
  • 2.1.1 什么是中文信息处理
  • 2.1.2 中文文本信息处理的特点
  • 2.2 中文文本信息处理关键技术
  • 2.2.1 中文分词技术
  • 2.2.2 中文词性标注和语义标注技术
  • 2.2.3 中文语句分析技术
  • 2.3 常用中文分词器
  • 2.4 小结
  • 第3章 本体论的相关知识
  • 3.1 本体论概述
  • 3.1.1 本体的定义
  • 3.1.2 本体的功能
  • 3.1.3 本体的分类
  • 3.2 本体与语义网
  • 3.3 本体的代数系统
  • 3.4 本体与描述逻辑
  • 3.4.1 描述逻辑的定义
  • 3.4.2 描述逻辑的体系结构
  • 3.4.3 描述逻辑支持的推理
  • 3.5 本体描述语言OWL
  • 3.5.1 OWL 简介
  • 3.5.2 OWL 本体的结构及构造符
  • 3.6 小结
  • 第4章 基于本体的语义数据挖掘(OSDM)技术
  • 4.1 语义与知识表示
  • 4.1.1 语义的概念
  • 4.1.2 知识和知识表示
  • 4.2 基于本体的知识表示
  • 4.2.1 传统的知识表示的不足
  • 4.2.2 基于本体的知识表示方式
  • 4.3 传统的数据挖掘技术
  • 4.4 基于本体的语义数据挖掘技术OSDM 模型
  • 4.5 OSDM 模型的关键技术研究
  • 4.5.1 领域本体构建
  • 4.5.2 语义标注
  • 4.5.3 语义推理
  • 4.6 小结
  • 第5章 OSDM 技术在中文信息检索系统中的应用
  • 5.1 系统介绍和总体结构
  • 5.1.1 系统功能
  • 5.1.2 系统总体结构
  • 5.1.3 系统主要开发工具
  • 5.2 系统各模块的实现
  • 5.2.1 信息获取及存储模块的实现
  • 5.2.2 全文信息检索模块的实现
  • 5.2.3 MyFruitOnto 本体的构建
  • 5.2.4 语义标注模块的实现
  • 5.2.5 OSDM 模块的实现
  • 5.3 实验系统演示
  • 5.4 实验结果分析
  • 5.5 小结
  • 结论
  • 参考文献
  • 致谢
  • 附录A 攻读学位期间所发表的学术论文目录
  • 附录B 攻读学位期间所参加的科研项目
  • 相关论文文献

    • [1].数据挖掘技术在网络营销中的应用构架实践[J]. 营销界 2019(19)
    • [2].数据挖掘技术综述浅析[J]. 数字技术与应用 2019(10)
    • [3].基于云计算的数据挖掘技术研究[J]. 无线互联科技 2019(22)
    • [4].数据挖掘技术在录井原油性质判别中的应用[J]. 录井工程 2019(04)
    • [5].大数据挖掘技术在高职教育教学过程中的应用研究[J]. 计算机产品与流通 2020(01)
    • [6].基于大数据背景的数据挖掘技术算法研究[J]. 信息技术与信息化 2019(12)
    • [7].基于云计算技术视角的大数据挖掘技术分析[J]. 数字技术与应用 2019(11)
    • [8].基于数据挖掘技术的“肥仔水”市场潜力分析——以八爪鱼为例[J]. 电脑知识与技术 2019(34)
    • [9].数据挖掘技术在互联网领域的应用研究[J]. 电脑知识与技术 2019(36)
    • [10].数据挖掘技术在数据统计工作中的应用分析[J]. 中外企业家 2020(05)
    • [11].基于数据挖掘技术的荨麻疹治疗研究综述[J]. 科技与创新 2020(04)
    • [12].基于数据挖掘技术的创新设计思维研究[J]. 设计 2020(03)
    • [13].数据挖掘技术在中医肝系病中的应用现状[J]. 江西中医药大学学报 2020(01)
    • [14].数据挖掘技术在中医辨证施治中的应用[J]. 教育教学论坛 2020(03)
    • [15].数据挖掘技术在军队预算管理中的应用探析[J]. 财务与会计 2019(19)
    • [16].云计算背景下物联网数据挖掘技术分析与实验验证[J]. 数字通信世界 2020(02)
    • [17].数据挖掘技术在经济统计中的应用研究[J]. 中国市场 2020(08)
    • [18].基于数据挖掘技术的学情分析系统分析与设计[J]. 电脑编程技巧与维护 2020(01)
    • [19].数据挖掘技术及其分析方法在大通水文站降水规律分析中的应用[J]. 科学技术创新 2020(03)
    • [20].数据挖掘在油田开采中的应用方法分析[J]. 门窗 2019(18)
    • [21].电网故障信息数据挖掘技术的分析[J]. 科技创新导报 2019(33)
    • [22].基于数据挖掘技术的高职院校财务管理风险管控研究[J]. 河北建筑工程学院学报 2019(03)
    • [23].数据挖掘技术支持下的妇幼保健院档案整合策略[J]. 黑龙江档案 2020(01)
    • [24].基于数据挖掘技术的高校人才培养模式评价与优化[J]. 大连民族大学学报 2020(01)
    • [25].探究计算机数据挖掘技术的开发及其应用[J]. 计算机产品与流通 2020(03)
    • [26].数据挖掘技术在经济统计中的应用研究[J]. 现代商业 2020(05)
    • [27].数据挖掘技术在软件工程中的应用[J]. 信息通信 2020(02)
    • [28].管理会计中数据挖掘技术的应用研究[J]. 信息记录材料 2020(01)
    • [29].基于数据挖掘技术的图书馆个性化系统设计[J]. 长春师范大学学报 2020(04)
    • [30].数据挖掘技术在教育信息中的应用探索[J]. 信息通信 2020(03)

    标签:;  ;  ;  ;  

    中文信息的语义数据挖掘技术研究
    下载Doc文档

    猜你喜欢