基于树型条件随场的特定域事件提取方法研究

基于树型条件随场的特定域事件提取方法研究

论文摘要

事件提取是指把非结构化文本中出现的事件的时间,地点,事件主体和事件的具体内容提取出来。随着垂直搜索引擎的出现,事件提取作为信息提取的一个研究方面,近年来成为研究的热点,并被应用到信息提取的许多领域,如信息检索、垂直搜索引擎等。本论文主要针对web上存在的大量简历类型的网页,研究如何利用文本分类技术自动识别简历并下载;并在此基础上进一步研究如何利用条件随机场从非结构化的简历文本提取出结构化的事件信息。论文首先对当前常用的分类方法和事件提取模型进行了总结和回顾,比较和研究了当前文本分类和事件提取研究的进展、各自常用的方法和模型。其次,本文结合社会标注及传统的文档向量模型技术提出了一种融合社会标注和文本词频的新的文档向量表示模型,利用新的模型构建文档的表示并结合传统的文本分类方法可有效地提高分类精度。最后,通过分析简历信息具有层次结构这一特点,利用树型条件随机场来建模简历文本中的层次化信息,并实现了基于树型条件随机场提取简历文本中事件的原型系统。本文还针对所提出的融合社会标注及文本词频的向量模型和基于树型条件随机场的事件提取算法做了大量的文本分类实验和事件提取实验。实验结果显示,本文所提出的方法针对特定领域的文本分类及事件提取具有较好的效果。

论文目录

  • 摘要
  • Abstract
  • 1 绪论
  • 1.1 课题研究背景
  • 1.2 课题研究的目的和意义
  • 1.3 国内外相关技术研究现状
  • 1.4 论文的主要研究内容
  • 2 相关理论概述
  • 2.1 向量空间模型概述
  • 2.2 文本分类的概述
  • 2.3 概率图模型的概述
  • 2.4 条件随机场的概述
  • 2.5 本章小结
  • 3 基于树型条件随机场的简历信息提取的方法研究
  • 3.1 简历事件提取系统框架
  • 3.2 结合社会标注的文本分类方法研究
  • 3.3 基于树型条件随机场的简历事件提取研究
  • 3.4 简历事件提取具体实现
  • 3.5 本章小结
  • 4 实验与分析
  • 4.1 简历数据集获取
  • 4.2 实验分析评价方法
  • 4.3 实验结果及性能分析
  • 4.4 本章小结
  • 5 总结与展望
  • 5.1 全文总结
  • 5.2 进一步的研究方向
  • 致谢
  • 参考文献
  • 附录1 攻读硕士学位期间参与项目
  • 相关论文文献

    • [1].基于条件随机场的古文自动断句与标点方法[J]. 清华大学学报(自然科学版)网络.预览 2009(10)
    • [2].基于字向量的条件随机场的中文分词方法[J]. 武汉船舶职业技术学院学报 2019(04)
    • [3].基于动态密集条件随机场增量推理计算的多类别视频分割[J]. 计算机应用研究 2020(12)
    • [4].条件随机场框架下基于随机森林的城市土地利用/覆盖遥感分类[J]. 国土资源遥感 2014(04)
    • [5].基于局部特征和隐条件随机场的场景分类方法[J]. 北京理工大学学报 2012(07)
    • [6].组合全卷积神经网络和条件随机场的道路分割[J]. 清华大学学报(自然科学版) 2018(08)
    • [7].基于隐条件随机场的声调建模及区分性模型权重训练(英文)[J]. Transactions of Nanjing University of Aeronautics & Astronautics 2008(01)
    • [8].基于条件随机场的软件变更影响分析方法[J]. 航天控制 2019(01)
    • [9].基于条件随机场的协议异常检测[J]. 深圳信息职业技术学院学报 2018(02)
    • [10].基于层叠条件随机场的微博热点话题跟踪[J]. 计算机应用与软件 2016(04)
    • [11].基于条件随机场的新浪微博情感倾向性研究[J]. 网络安全技术与应用 2014(10)
    • [12].基于层叠条件随机场的高棉语分词及词性标注方法[J]. 中文信息学报 2016(04)
    • [13].结合编码-解码网络和条件随机场的全极化合成孔径雷达土地覆盖分类[J]. 模式识别与人工智能 2019(12)
    • [14].全连接条件随机场高分辨率遥感影像面状地物交互提取[J]. 武汉大学学报(信息科学版) 2020(10)
    • [15].基于融合分层条件随机场的道路分割模型[J]. 机器人 2018(06)
    • [16].基于隐条件随机场的人体行为识别方法[J]. 天津大学学报(自然科学与工程技术版) 2013(10)
    • [17].基于字级别条件随机场的医学实体识别[J]. 智能计算机与应用 2019(02)
    • [18].基于条件随机场的评价对象抽取[J]. 计算机系统应用 2017(11)
    • [19].基于条件随机场的人物信息抽取[J]. 计算技术与自动化 2015(04)
    • [20].结合场景结构和条件随机场的道路检测[J]. 华中科技大学学报(自然科学版) 2016(09)
    • [21].基于层叠条件随机场的网络入侵识别[J]. 江苏科技大学学报(自然科学版) 2008(05)
    • [22].基于词典与条件随机场的中文菜名识别研究[J]. 信息与电脑(理论版) 2018(17)
    • [23].基于层叠条件随机场的中文医疗机构名识别[J]. 济南大学学报(自然科学版) 2017(01)
    • [24].基于深度语义分割的遥感图像海面舰船检测研究[J]. 仪器仪表学报 2020(01)
    • [25].融合可变形卷积与条件随机场的遥感影像语义分割方法[J]. 测绘学报 2019(06)
    • [26].基于条件随机场方法的开放领域新词发现[J]. 软件学报 2013(05)
    • [27].基于条件随机场的古汉语自动断句与标点方法[J]. 清华大学学报(自然科学版) 2009(10)
    • [28].基于条件随机场的视频运动目标可靠性检测方法[J]. 计算机技术与发展 2020(07)
    • [29].基于条件随机场的目标跟踪算法研究[J]. 工业控制计算机 2012(09)
    • [30].基于循环层叠条件随机场的评价对象识别[J]. 兰州理工大学学报 2018(01)

    标签:;  ;  ;  ;  

    基于树型条件随场的特定域事件提取方法研究
    下载Doc文档

    猜你喜欢