论文摘要
随着因特网和信息产业的快速发展,越来越多的信息出现在人们面前,许多新兴的信息处理技术也应运而生。作为其中基础研究项目的关系抽取技术自然成为研究的热点之一。关系抽取在信息检索、专家系统、垂直搜索等领域有着广泛应用,对其研究具有深远意义。本文首先分析比较了关系抽取的各种技术,并着重研究了机器学习方法中的支持向量机(SVM)算法。研究发现传统的关系抽取技术,例如SVM等,对简单关系抽取的效果很好,但因其不具有语义识别能力,所以对复杂关系的抽取存在一定困难。针对这一问题本文在人工智能领域的本体方向找到了解决方案。在对本体进行了系统研究,对本体建模元素、构建方法深入分析后,本文结合电子产品特征提出了一种适用于关系抽取系统的领域本体建设方法,并选取电子产品中的笔记本电脑领域作为代表进行具体实现。在此基础上为解决上述问题,本文提出一种基于融合模式的关系抽取方法。该方法利用机器学习领域中的支持向量机(SVM)算法进行单一关系抽取,再使用本体对单一关系排错后,将其融合为关系网,最后利用本体的推理功能对关系进行再挖掘,使其形成更为复杂的关系网,用于由近距离依赖结构的关系,推理出远距离依赖结构的关系。这种模式继承了SVM和本体的优点,解决了复杂关系抽取问题。本文最后针对提出模型进行了具体实现。由于选取的本体领域的特殊性,本文自组织语料库,对实现系统进行验证。经分析调整后,取得了很好的准确率和召回率。
论文目录
摘要Abstract第一章 绪论1.1 研究背景及意义1.1.1 研究背景1.1.2 研究意义1.2 国内外研究现状1.2.1 国外研究现状1.2.2 国内研究现状1.3 论文主要工作1.4 论文结构第二章 关系抽取主要方法及工具2.1 关系抽取的概念2.2 关系抽取的主要技术2.2.1 基于规则匹配的关系抽取2.2.2 基于词典驱动的关系抽取2.2.3 基于机器学习的关系抽取2.2.4 基于本体的关系抽取2.2.5 关系抽取难点2.3 支持向量机(SVM)2.3.1 最优分类面2.3.2 核函数2.4 关系抽取工具GATE2.4.1 GATE 组件2.4.2 GATE 系统的整体框架2.4.3 抽取规则组件JAPE2.4.4 基于GATE 的开发方式2.5 本章小结第三章 本体及电子产品的本体建设3.1 本体概念3.1.1 本体分类3.1.2 本体的描述语言和常用工具3.2 本体建模元素3.3 电子产品领域本体建设方法和应用3.3.1 本体建设方法3.3.2 笔记本电脑本体建设3.4 本章小结第四章 系统的设计和实现4.1 系统设计和框架4.1.1 基于融合的关系抽取方法4.1.2 系统框架4.2 预处理模块4.3 实体识别模块4.4 关系抽取模块4.5 关系融合模块4.6 系统测试结果和分析4.7 本章小结第五章 总结与展望5.1 工作总结5.2 展望致谢参考文献读研期间研究成果
相关论文文献
标签:关系抽取论文; 本体论文;