人物言论抽取与跟踪技术研究

人物言论抽取与跟踪技术研究

论文摘要

面对互联网信息量的不断扩张,用户迫切地需要自动化的信息获取工具来帮助在海量的信息源中迅速找到和获得真正所需的信息。本文围绕人物言论的抽取与跟踪这一课题展开研究,探讨如何根据用户所感兴趣的某一话题,或者和用户所感兴趣的某一人物言论相关的话题,跟踪到一系列人(人物,团体或机构)所发表的关于此话题的言论,并对其进行识别和抽取。本文从言论的自动识别与抽取,和相关言论的话题跟踪两个关键环节进行深入研究。本文将新闻报道中每次出现的人物言论,看作是一个特殊的事件类型,即言论事件。对于言论事件的识别问题,本研究建立了一个规模适当的针对言论事件的语料库资源,采用机器学习的方法对候选言论进行判别。本文从上下文信息、事件核心元素以及元素间依赖等几个方面给出描述言论事件的特征。并通过对比实验的结果,分析了训练语料的规模和特征的选择对基于最大熵模型的分类方法性能的显著影响。最后,本文采用半自动构建的优化的触发词集,当训练语料的规模达到350篇新闻报道,总计716个正例,160个反例时,系统的F值得到了87.8%的最好结果。在跟踪设计中本文采用了基于查询向量的跟踪设计,分析了不同的相似度计算方法和相应的阈值调整对于系统的漏报率、误报率以及整体归一化开销的影响。并通过对比实验分析,在使用Weighted Sum相似度计算方法的情况下,采用最优的查询扩展策略并进行阈值调整,系统归一化开销得到了0.3908的最好结果。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 课题研究的背景和意义
  • 1.2 事件抽取的研究现状与分析
  • 1.2.1 会议驱动
  • 1.2.2 基于模式匹配的事件抽取
  • 1.2.3 基于机器学习的事件抽取
  • 1.3 话题跟踪的研究现状与分析
  • 1.3.1 话题和报道的表示模型
  • 1.3.2 相似度的计算方法
  • 1.3.3 话题跟踪算法
  • 1.4 本文的主要研究内容和组织结构
  • 第2章 言论的自动识别与抽取
  • 2.1 语料库资源
  • 2.1.1 ACE 的语料资源
  • 2.1.2 言论事件语料资源的建立
  • 2.2 建立候选言论事件集
  • 2.3 言论事件的二元判别
  • 2.3.1 基于最大熵模型的二元分类
  • 2.3.2 言论事件特征的选择
  • 2.4 言论事件的抽取
  • 2.5 试验结果与分析
  • 2.5.1 评价方法
  • 2.5.2 语料库规模与特征的贡献度
  • 2.5.3 特征参数的选择
  • 2.6 本章小结
  • 第3章 相关言论的跟踪
  • 3.1 话题和报道的VSM 表示
  • 3.2 权重的计算
  • 3.3 相似度计算
  • 3.4 基于查询向量的跟踪设计
  • 3.5 实验结果与分析
  • 3.5.1 评测方法
  • 3.5.2 相似度算法的选择与阈值
  • 3.5.3 查询扩展策略
  • 3.6 本章小结
  • 第4章 人物言论抽取与跟踪系统的设计与实现
  • 4.1 系统的结构设计
  • 4.2 系统的实现及运行成果
  • 4.3 系统性能分析
  • 结论
  • 参考文献
  • 致谢
  • 相关论文文献

    • [1].基于核心依存图的新闻事件抽取[J]. 山东大学学报(理学版) 2016(09)
    • [2].基于语言特征的舆情事件抽取[J]. 信息安全与通信保密 2015(04)
    • [3].事件关系检测的语言学资源、评测及研究综述[J]. 智能计算机与应用 2014(02)
    • [4].基于事件抽取的网络新闻多文档自动摘要[J]. 中文信息学报 2012(01)
    • [5].微博中的开放域事件抽取[J]. 计算机应用与软件 2016(08)
    • [6].基于神经网络方法的事件抽取研究[J]. 现代计算机 2020(06)
    • [7].自底向上事件抽取系统(英文)[J]. Frontiers of Information Technology & Electronic Engineering 2015(07)
    • [8].浅析股市新闻中的金融事件对上市公司的影响[J]. 商讯 2019(26)
    • [9].基于事件图的新闻标题生成研究[J]. 乐山师范学院学报 2017(04)
    • [10].基于句法分析的临床指南事件及事件关系提取[J]. 武汉大学学报(理学版) 2015(02)
    • [11].一个半监督的中文事件抽取方法[J]. 中文信息学报 2016(02)
    • [12].基于事件抽取的竞争情报系统[J]. 情报理论与实践 2014(05)
    • [13].事件信息抽取中的数据预处理方法研究[J]. 计算机应用与软件 2011(08)
    • [14].基于指代消解的中文事件融合方法[J]. 计算机应用 2009(08)
    • [15].基于卷积树核的事件论元角色抽取方法[J]. 小型微型计算机系统 2016(04)
    • [16].基于CRFs和跨事件的事件识别研究[J]. 计算机工程 2012(24)
    • [17].一种基于文献的科研事件库构建方法[J]. 情报理论与实践 2017(09)
    • [18].事件超图模型及类型识别[J]. 中文信息学报 2013(01)
    • [19].面向网络舆情数据的异常行为识别[J]. 计算机研究与发展 2016(03)
    • [20].中文事件抽取研究文献之算法效果分析[J]. 现代情报 2015(12)
    • [21].中文事件抽取技术研究[J]. 中文信息学报 2008(01)
    • [22].利用框架语义知识优化事件抽取[J]. 中文信息学报 2017(02)
    • [23].基于句法依存分析的事件角色填充研究[J]. 情报科学 2017(07)
    • [24].公共卫生类突发事件的抽取研究[J]. 情报理论与实践 2016(04)
    • [25].融合语义与事件特征的重大事件趋势预测[J]. 计算机工程与应用 2020(17)
    • [26].基于马尔可夫模型的新闻事件抽取方法[J]. 桂林电子科技大学学报 2015(04)
    • [27].基于知网的中文事件抽取研究[J]. 情报杂志 2009(S2)
    • [28].事件抽取技术研究综述[J]. 情报理论与实践 2013(04)
    • [29].基于Bi-LSTM和TFIDF的工单事件提取[J]. 电脑知识与技术 2020(04)
    • [30].中文新闻关键事件的主题句识别[J]. 北京大学学报(自然科学版) 2011(05)

    标签:;  ;  ;  ;  

    人物言论抽取与跟踪技术研究
    下载Doc文档

    猜你喜欢