从大规模中文语料中获取知识模式的研究

从大规模中文语料中获取知识模式的研究

论文摘要

知识获取被认为是一项非常困难和耗时耗力的任务,几十年来一直是阻碍智能系统等研究和开发的瓶颈问题。互联网时代,大量的信息都以非结构化的文本形式存在。由于自然语言处理的歧义性(Ambiguity)和非规范性(Ill-Fonnedness)两大类问题,使得计算机自动文本知识获取被认为是一项非常困难和费时的任务。基于模式的方法在文本知识获取系统中被普遍使用,并取得很好的结果。因此如何获取所需的模式成为重要的研究问题。本文主要研究如何从大规模语料中获取语义模式,开展了如下的工作:1)非监督的介词-动词模式自动获取。动词介词模式是自然语言表述关系型知识的一种主要形式,通过“什么”疑问词的引入降低模式获取的复杂性。首先引入了基于条件概率的过滤规则对介词动词组合进行过滤;然后构造查询项,通过Google搜索引擎从Internet上获取语料;最后从“概念词和概念词之间的相关性”、“概念词和模式词之间的相关性”和“模式词和模式词之间的相关性”的角度定义了六种度量,并基于这几种度量对获取的模式进行评价。实验结果证明,这六种度量是很好的模式定量特征。2)模式库的扩充。按照类比学习的思想提出了模式扩充的方法。以模式的词汇语法层相关性为基础进行模式的扩充。最后沿用了模式获取阶段的模式评价方法对模式进行评价。3)提出模式专一性的度量方法。模式的适用范围大小是基于模式进行知识获取过程中重要的信息。适用范围体现在模式能表达的概念的类别集合上,而模式不同位置(<?Ci>)能表达概念的类别集合是不同的,为此需要对模式的的不同位置分别进行度量。我们将这种适用范围的大小的度量定义为专一性。本文分别通过深度、概念集抽象和墒的方法度量专一性。通过分析发现这三种度量基本上与人感觉的专一程度吻合。

论文目录

  • 摘要
  • Abstract
  • 目录
  • 表格目录
  • 图目录
  • 第一章 引言
  • 1.1 文本知识获取介绍
  • 1.1.1 文本知识获取含义
  • 1.1.2 文本知识获取的目标与手段
  • 1.1.3 国家基础知识设施
  • 1.1.4 模式的作用
  • 1.2 国内外研究现状与分析
  • 1.2.1 命名实体识别
  • 1.2.2 语义关系获取
  • 1.2.3 主要的关系知识获取的研究项目
  • 1.2.4 研究现状的分析与比较
  • 1.3 本文的主要研究内容
  • 1.4 本文的组织
  • 第二章 语义模式获取的框架
  • 2.1 获取语义模式的目的
  • 2.2 基本假设
  • 2.3 语义模式的表示
  • 2.3.1 语义模式的结构
  • 2.3.1.1 词汇语法结构
  • 2.3.1.2 词汇语法限制
  • 2.3.1.3 定性限制
  • 2.3.1.4 定量限制
  • 2.3.1.5 特性描述
  • 2.4 评价的标准
  • 2.4.1 精度/召回率标准
  • 2.5 模式获取系统的结构
  • 2.5.1 模式获取单元
  • 2.5.2 模式扩充单元
  • 2.5.3 模式分析单元
  • 2.5.4 模式评价单元
  • 2.6 小结
  • 第三章 动词-介词模式的获取方法
  • 3.1 获取动词-介词模式的目的
  • 3.2 “什么”疑问词的作用
  • 3.3 介词-动词模式的特征
  • 3.3.1 简单表示能力度量
  • 3.3.2 概念词集合投影度量
  • 3.3.3 潜层语义度量
  • 3.3.4 概念词之间句子级互信息度量
  • 3.3.5 概念词之间文档级互信息度量
  • 3.3.6 概念词和模式词之间相关性度量
  • 3.4 PV模式获取的步骤
  • 3.5 小结
  • 第四章 模式的扩充
  • 4.1 目的
  • 4.2 扩展方法
  • 4.3 模式扩充算法
  • 4.4 特征构造
  • 4.5 小结
  • 第五章 模式的性质分析
  • 5.1 目的
  • 5.2 上下位概念空间
  • 5.3 专一性需要满足的性质
  • 5.4 专一性的几种定义
  • 5.4.1 基于深度的专一性定义
  • 5.4.1.1 概念集合上位扩展
  • 5.4.1.2 基于深度的专一性性质分析
  • 5.4.2 基于概念集抽象的专一性定义
  • 5.4.2.1 基于概念集抽象的专一性分析
  • 5.4.3 基于熵的概念集抽象定义
  • 5.4.3.1 熵概念的引入
  • 5.4.3.2 类概念集合的分布构造
  • 5.4.4 专一性示例及分析
  • 5.4.5 模式的专一性定义
  • 5.5 符号说明
  • 5.6 小结
  • 第六章 实验结果及分析
  • 6.1 实验结果
  • 6.2 实验结果分析
  • 6.3 小结
  • 第七章 结束语
  • 7.1 本文总结
  • 7.2 今后的工作及改进
  • 参考文献
  • 致谢
  • 作者简历
  • 相关论文文献

    • [1].知识员工隐性知识获取与工作结构的关系研究[J]. 东方企业文化 2015(01)
    • [2].知识获取研究回顾与未来展望[J]. 山东青年政治学院学报 2018(01)
    • [3].关系强度、社会资本对知识获取绩效影响研究——基于社会结构与行动模型[J]. 预测 2015(01)
    • [4].数字校园知识获取平台的构建[J]. 安徽商贸职业技术学院学报(社会科学版) 2015(02)
    • [5].浅议内隐认知与隐性知识获取[J]. 中国校外教育 2012(16)
    • [6].社会网络对企业知识获取的影响研究[J]. 吉林农业 2012(09)
    • [7].基于创新视角的知识获取理论研究[J]. 科学管理研究 2008(02)
    • [8].组织间知识获取研究述评与未来展望[J]. 上海管理科学 2018(02)
    • [9].基于联盟知识获取影响的信任与契约治理的关系研究[J]. 管理学报 2016(06)
    • [10].服务知识获取模式对服务创新绩效影响研究——以服务型制造企业为例[J]. 科技进步与对策 2015(09)
    • [11].巧用Web2.0代表性软件进行网络知识获取[J]. 现代企业教育 2010(08)
    • [12].我国农村知识获取环境缺陷与对策探讨[J]. 图书情报研究 2013(01)
    • [13].建筑工人安全知识获取行为影响因素实证研究[J]. 建筑安全 2020(09)
    • [14].组织学习影响组织创造力的知识获取路径研究[J]. 管理科学 2013(02)
    • [15].面向产品设计的隐性知识获取关键技术研究[J]. 科技进步与对策 2011(19)
    • [16].某型雷达故障知识获取新方法[J]. 科学技术与工程 2009(19)
    • [17].网络时代的知识付费与知识获取[J]. 探索与争鸣 2019(07)
    • [18].知识员工隐性知识获取与工作绩效的关系研究[J]. 经济研究导刊 2015(04)
    • [19].试论农民知识化与知识获取环境建设[J]. 农业经济 2011(12)
    • [20].营销渠道中的知识获取与转移[J]. 经济导刊 2008(02)
    • [21].面向复杂产品研发的多源异构知识获取技术研究[J]. 制造业自动化 2018(02)
    • [22].个体主动社会化行为对知识获取的作用机制研究:基于工作场所移动非正式学习网络情境[J]. 南大商学评论 2018(03)
    • [23].网络能力、隐性知识获取与新创企业成长绩效[J]. 科学学研究 2011(09)
    • [24].知识获取性视角下隐性知识的转化和流动[J]. 科学学与科学技术管理 2010(03)
    • [25].基于半自动化知识获取的操作票专家系统的研究与实现[J]. 信息化纵横 2009(06)
    • [26].网络能力、组织隐性知识获取与突破性创新绩效[J]. 科研管理 2014(01)
    • [27].基于知识转换的图书馆知识获取研究[J]. 现代经济信息 2010(06)
    • [28].基于知识获取成本的企业网络效率边界分析[J]. 商业时代 2009(10)
    • [29].高新技术企业隐性知识获取水平与核心竞争力的关系研究[J]. 中北大学学报(社会科学版) 2019(06)
    • [30].契约完备程度对隐性知识获取影响的实证研究[J]. 科研管理 2018(12)

    标签:;  ;  ;  ;  ;  ;  

    从大规模中文语料中获取知识模式的研究
    下载Doc文档

    猜你喜欢