领域本体概念实例、属性及属性值提取研究

领域本体概念实例、属性及属性值提取研究

论文摘要

本体概念实例、属性及属性值是领域本体知识库的重要组成部分,是领域本体知识库自动或半自动构建的一个基础性研究工作的重点,对其提取的准确性与丰富程度直接影响了领域本体知识库的应用性能。目前国内外相关研究主要集中在本体概念实例及属性的提取,或是概念属性与属性值对的提取,并取得了一定的进展。但在领域本体知识库构建和应用过程中,只有将本体概念实例、属性及其属性值相结合起来才具有实用意义。本文围绕本体概念实例、属性及属性值同步提取做了以下几方面的工作:1.针对领域本体概念实例、属性及属性值特点,结合条件随机场CRFS (Conditional Random Fields, CRFS)和支持向量机(Support Vector Machines, SVM)两种机器学习算法优势进行本体概念实例、属性及属性值的同步提取。利用分类的思想将本体概念实例、属性及属性值看作3类实体,进行实体识别,并在此基础上进一步做实体对应关系确定,最终实现了本体概念实例、属性及属性值的同步提取,该方法通过在云南旅游领域景点概念实例、属性及属性值进行实验验证,开放测试的准确率、召回率和F值分别到达84.39%、82.73%和83.55%,可见该方法具有一定的可行性和实用性。2.详细介绍了基于条件随机场的本体概念实例、属性及属性值的实体识别。分析了本体概念实例、属性及属性值在自由文本结构中的特征及其本身特性,结合条件随机场表达长距离依赖性和交叠性特征的能力及其较好的解决标注(分类)偏置等问题的优点进行三类实体识别。3.详细介绍了基于支持向量机的本体概念实例、属性及属性值三类实体对应关系提取。分析了本体概念实例、属性及属性值三类实体对应关系中实体本身的特点及实体出现在句子结构中的特征,结合支持向量机适宜在高维空间构造最优分类超平面的特点进行三类实体对应关系的确定。4.结合以上工作实现了本体概念实例、属性及属性值同步提取原型系统。并在此基础上了做了本体概念实例、属性及属性值提取评测。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 研究背景及意义
  • 1.2 国内外研究现状
  • 1.3 本文的主要研究内容
  • 1.4 论文的组织
  • 第二章 本体概念实例、属性及属性值提取研究综述
  • 2.1 引言
  • 2.2 本体概念实例、属性及属性值提取难点
  • 2.3 本体概念实例、属性及属性值特点
  • 2.4 本体概念实例、属性及属性值提取的主要方法
  • 2.4.1 基于规则的方法
  • 2.4.2 基于统计的机器学习的方法
  • 2.4.3 基于半结构化/结构化数据的方法
  • 2.5 基于联合分类器的本体概念实例、属性及属性值同步提取
  • 2.5.1 方法思想
  • 2.5.2 关键任务
  • 2.6 本章小结
  • 第三章 基于CRFs的本体概念实例、属性及属性值的实体识别
  • 3.1 引言
  • 3.2 条件随机场(CRFs)
  • 3.3 特征模板
  • 3.3.1 景点概念实例的特征模板制定
  • 3.3.2 景点概念属性的特征模板制定
  • 3.3.3 景点概念属性值的特征模板制定
  • 3.4 特征选择
  • 3.5 实验设计与分析
  • 3.5.1 语料与评测指标
  • 3.5.2 实验设计
  • 3.5.3 实验实现
  • 3.5.4 实验结果与分析
  • 3.6 本章小结
  • 第四章 基于SVM的本体概念实例、属性及属性值间对应关系提取
  • 4.1 引言
  • 4.2 支持向量机(SVM)
  • 4.3 特征设计
  • 4.3.1 词特征集(WORD)
  • 4.3.2 词性特征集(POS)
  • 4.3.3 实体类别特征集(ET)
  • 4.3.4 实体类别顺序特征集(EO)
  • 4.3.5 实体间隔距离特征(ED)
  • 4.4 实验设计与分析
  • 4.4.1 实验数据及评测指标
  • 4.4.2 实验设计
  • 4.4.3 实验实现
  • 4.4.4 实验结果与分析
  • 4.5 本章小结
  • 第五章 系统设计与实验分析
  • 5.1 引言
  • 5.2 系统结构
  • 5.2.1 实体识别模块
  • 5.2.2 实体对应关系提取模块
  • 5.3 实验设计与分析
  • 5.3.1 实验数据与评测指标
  • 5.3.2 实验设计
  • 5.3.3 实验实现
  • 5.3.4 实验结果分析
  • 5.4 部分识别结果展示
  • 5.6 本章小结
  • 第六章 总结与展望
  • 6.1 总结
  • 6.2 展望
  • 致谢
  • 参考文献
  • 附录A 攻读硕士学位期间发表的学术论文
  • 附录B 攻读硕士学位期间参与的项目
  • 附录C 知识列表
  • 相关论文文献

    • [1].动态更新属性值变化时的最优粒度[J]. 小型微型计算机系统 2020(10)
    • [2].基于属性值和上下文的开放数据相同属性识别[J]. 情报理论与实践 2017(11)
    • [3].桥梁专业[J]. 铁路技术创新 2018(04)
    • [4].隧道专业[J]. 铁路技术创新 2018(04)
    • [5].轨道专业[J]. 铁路技术创新 2018(04)
    • [6].路基专业[J]. 铁路技术创新 2018(04)
    • [7].站场专业[J]. 铁路技术创新 2018(04)
    • [8].信号专业[J]. 铁路技术创新 2018(04)
    • [9].电力专业[J]. 铁路技术创新 2018(04)
    • [10].牵引变电专业[J]. 铁路技术创新 2018(04)
    • [11].接触网专业[J]. 铁路技术创新 2018(04)
    • [12].环境保护专业[J]. 铁路技术创新 2018(04)
    • [13].机务专业[J]. 铁路技术创新 2018(04)
    • [14].景观专业[J]. 铁路技术创新 2018(04)
    • [15].自然灾害及异物侵限监测专业[J]. 铁路技术创新 2018(04)
    • [16].土地利用专业[J]. 铁路技术创新 2018(04)
    • [17].“标准属性值”理论与同义异素形容词研究[J]. 赤峰学院学报(汉文哲学社会科学版) 2013(05)
    • [18].属性值加权的一依赖估测器模型分类算法研究[J]. 计算机工程 2020(11)
    • [19].基于模糊规则的随机缺失属性值数据分类算法[J]. 吉林大学学报(理学版) 2019(01)
    • [20].面向主属性值的类标特征分析[J]. 东北大学学报(自然科学版) 2016(10)
    • [21].给排水专业[J]. 铁路技术创新 2018(04)
    • [22].多标签符号型属性值划分的聚类方法[J]. 山东大学学报(理学版) 2020(03)
    • [23].植物属性地理的研究进展与展望[J]. 地理科学进展 2018(01)
    • [24].一种新的决策表属性值分类方法[J]. 苏州科技学院学报(自然科学版) 2016(01)
    • [25].面向属性值遗漏数据决策树分类算法研究[J]. 计算机科学 2011(10)
    • [26].基于元性质的数量型属性值自动提取系统的实现[J]. 计算机研究与发展 2010(10)
    • [27].信息专业[J]. 铁路技术创新 2018(04)
    • [28].一种区间属性值离散化的新方法[J]. 宇航学报 2009(03)
    • [29].基于统计学法则的连续属性值划分方法[J]. 科学技术与工程 2018(16)
    • [30].面向个体和敏感属性值的匿名数据发布[J]. 计算机应用与软件 2012(06)

    标签:;  ;  ;  ;  ;  

    领域本体概念实例、属性及属性值提取研究
    下载Doc文档

    猜你喜欢