基于事件的新闻报道分析技术研究

基于事件的新闻报道分析技术研究

论文摘要

新闻报道是信息的重要载体,日常生活中的很多信息都是以新闻报道记载、传播和交换的。面对这些潮水般涌来的新闻报道,人们迫切需要能够自动实现信息采集、过滤、整理和利用的各种智能业务。基于事件的新闻报道分析是非常有力的工具,其目的是有效地组织和处理海量的新闻信息。本文对这个具有重要理论意义和广阔应用前景的课题进行了研究和探索,所取得的主要成果如下:●提出了基于事件的新闻报道分析框架。该框架是在基于事件的新闻报道分析技术的概念分析和层次结构的基础上构建的,概念分析对相关术语的定义进行了剖析,并给出了基于事件的新闻报道分析的层次结构,技术框架则在概念分析和层次结构的基础上探讨了基于事件的新闻报道分析实现的技术途径,明确了本文重点研究的问题。●提出并改进了部分新闻事件探测方法。首先改进了基于增量K均值的事件探测法,针对传统的增量K均值法用于事件探测时不能够客观地选择初始聚类中心这一难点问题,本文使用密度函数法进行聚类中心的初始化,论文还对邻域密度有效半径和特征空间维数的选择问题进行了讨论;还提出了一种基于ICURE的事件探测法,该算法能够有效地解决传统聚类算法在计算复杂度、数据更新时所面临的问题。●提出并改进了部分新闻事件追踪方法。提出了一种用于事件追踪的基于K近邻特征线(KNNFL)的方法,将改进后的KNN融入到NFL中形成KNNFL是为了更适合新闻事件的分析;还提出了基于反例样本修剪支持向量机(NEP-SVM)的事件追踪法,该算法根据距离和类标决定一反例样本的取舍,最后将SVM的输出结果映射成后验概率。●提出了一种事件相关多文档摘要方法。其特色在于:在提取基本新闻要素和扩展新闻要素的基础上分别形成了基本局部主题句群和扩展局部主题句群,这样可以在尽可能全面地覆盖多个主题的同时缩减自身的冗余。●设计并实现了基于事件的新闻报道分析系统IEventMiner。详细地描述了IEventMiner系统的设计思路和各功能模块,并介绍了原型系统的实现,从而对基于事件的新闻报道分析框架和相关方法进行了应用和验证。综上所述,论文的主要工作集中在基于事件的新闻报道分析的关键技术上,如事件探测、事件追踪以及事件相关多文档摘要等,在一些领域取得了一定程度的进展,实现的IEventMiner系统采用模块化的结构设计,易于系统功能的扩充和性能的完善。这些研究不仅会对系统工程技术产生积极的影响,对情报分析技术也具有很强的参考价值。

论文目录

  • 表目录
  • 图目录
  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 研究背景和意义
  • 1.2 国内外相关问题研究现状
  • 1.2.1 新闻事件探测技术研究现状
  • 1.2.2 新闻事件追踪技术研究现状
  • 1.2.3 新闻事件相关多文档摘要技术研究现状
  • 1.3 论文的研究内容和组织结构
  • 1.3.1 论文的研究内容
  • 1.3.2 论文的组织结构
  • 第二章 基于事件的新闻报道分析框架
  • 2.1 相关术语
  • 2.2 基于事件的新闻报道分析的层次结构
  • 2.3 基于事件的新闻报道分析的技术框架
  • 2.3.1 新闻事件探测
  • 2.3.2 新闻事件追踪
  • 2.3.3 新闻事件相关多文档摘要
  • 2.4 本章小结
  • 第三章 新闻事件的探测
  • 3.1 事件探测常用方法概述
  • 3.1.1 Single-pass法
  • 3.1.2 K均值法
  • 3.1.3 Constructive-Competition法
  • 3.1.4 基于层次的方法
  • 3.2 初始化类中心的增量K均值法在新闻事件探测中的应用
  • 3.2.1 传统的增量K均值法
  • 3.2.2 IIKM算法的操作步骤
  • 3.2.3 预处理过程和文档表示
  • 3.2.4 类中心初始化
  • 3.2.5 特征选择和相似度计算
  • 3.2.6 IIKM算法的说明
  • 3.3 基于分类增量集辅助CURE的事件探测
  • 3.3.1 选用CURE算法的理由
  • 3.3.2 CURE算法的原理分析
  • 3.3.3 基于分类增量集辅助CURE的事件探测方法描述
  • 3.3.4 算法的时空复杂性分析
  • 3.4 实验结果与讨论
  • 3.4.1 实验数据和评价指标
  • 3.4.2 实验一:选取不同邻域密度有效半径对事件探测系统性能的影响
  • 3.4.3 实验二:选取不同维数对事件探测系统性能的影响
  • 3.4.4 实验三:不同事件探测法在NUDT EventMining Corpus2.0上的性能比较
  • 3.4.5 实验四:不同事件探测法在TDT Pilot Study Corpus上的性能比较
  • 3.5 本章小结
  • 第四章 新闻事件的追踪
  • 4.1 事件追踪常用方法概述
  • 4.1.1 Rocchio法
  • 4.1.2 K近邻法
  • 4.1.3 决策树法
  • 4.1.4 语言模型法
  • 4.1.5 组合法
  • 4.2 基于KNNFL的事件追踪
  • 4.2.1 问题描述
  • 4.2.2 最近邻特征线(NFL)方法简介
  • 4.2.3 基于KNNFL的事件追踪算法步骤
  • 4.2.4 进一步的思考
  • 4.3 基于反例样本修剪支持向量机的事件追踪
  • 4.3.1 问题描述
  • 4.3.2 支持向量机简介
  • 4.3.3 预处理和文档表示
  • 4.3.4 概率化输出
  • 4.3.5 基于NEP-SVM的事件追踪步骤
  • 4.3.6 NEP-SVM事件追踪法的进一步改进
  • 4.4 实验结果与讨论
  • 4.4.1 实验一:在不同K值时采用KNNFL法追踪各事件时的系统性能
  • 4.4.2 实验二:NEP-SVM法在采用不同概率化输出阈值时追踪不同事件的系统性能
  • 4.4.3 实验三:NEP-SVM法在采用不同修剪半径时追踪不同事件的系统性能
  • 4.4.4 实验四:不同事件追踪法在TDT Pilot Study Corpus上的系统性能比较
  • 4.5 本章小结
  • 第五章 新闻事件相关多文档摘要
  • 5.1 事件相关多文档摘要常用方法概述
  • 5.1.1 基于统计的机械文摘
  • 5.1.2 基于意义的理解文摘
  • 5.2 文本预处理
  • 5.3 局部主题的确定
  • 5.4 事件相关多文档摘要的生成
  • 5.5 事件相关多文档摘要的评价
  • 5.6 事件RSU的检索与事件相关文档摘要
  • 5.6.1 事件RSU的切分和标题检测
  • 5.6.2 事件RSU检索的思路
  • 5.6.3 事件相关文档摘要应用于事件RSU检索
  • 5.7 实验结果与讨论
  • 5.7.1 实验一:事件相关多文档摘要实验结果
  • 5.7.2 实验二:TSP-KNN和普通KNN算法的检索效率比较
  • 5.8 本章小结
  • 第六章 基于事件的新闻报道分析系统IEVENTMINER的设计与实现
  • 6.1 任务背景
  • 6.2 IEventMiner系统的设计
  • 6.2.1 IEventMiner系统的设计思路
  • 6.2.2 IEventMiner系统的总体结构
  • 6.2.3 IEventMiner系统各功能模块定义
  • 6.3 IEventMiner系统的实现
  • 6.4 IEventMiner系统的特点
  • 6.5 本章小结
  • 第七章 总结与展望
  • 7.1 论文的主要贡献
  • 7.2 进一步的工作
  • 致谢
  • 参考文献
  • 附录A: 攻读博士学位期间发表和录用的论文
  • 附录B: 攻读博士学位期间参与的主要科研工作及获奖情况
  • 附录C: 论文中常用缩略语对照表
  • 附录D: 事件相关多文档摘要生成的部分结果
  • 相关论文文献

    • [1].模糊语言在新闻报道中的合理性运用分析[J]. 辽宁师专学报(社会科学版) 2019(05)
    • [2].浅谈如何做好文化新闻报道[J]. 新闻研究导刊 2019(22)
    • [3].新时期如何做好中国影视新闻报道[J]. 新闻研究导刊 2019(23)
    • [4].融媒体背景下新闻报道的创新探索——以《山东教育》杂志为例[J]. 青年记者 2019(35)
    • [5].媒体融合背景下新闻报道如何创新[J]. 传播力研究 2019(34)
    • [6].移动互联时代广电全媒体“两会”新闻报道创新探索[J]. 中国传媒科技 2019(12)
    • [7].创新广电新闻报道,打好五大“组合拳”——以汕湛高速茂名段建设主题宣传为例[J]. 传媒论坛 2020(02)
    • [8].为共和国庆生,我们使命必达——总台庆祝新中国成立70周年新闻报道纪实[J]. 电视研究 2019(12)
    • [9].读者观点[J]. 小康 2020(07)
    • [10].从网络舆论的“偏听偏信”谈新闻报道的平衡原则[J]. 新闻前哨 2020(01)
    • [11].让新闻报道“沾泥土”“带露珠”“冒热气”[J]. 青年记者 2020(03)
    • [12].让金融新闻报道“活”起来[J]. 中国地市报人 2020(01)
    • [13].媒介融合背景下地方媒体新闻报道存在问题及对策分析[J]. 西部广播电视 2020(06)
    • [14].新闻报道语篇同名回指转述的语用认知阐释[J]. 天津外国语大学学报 2020(03)
    • [15].科技新闻报道的创新和实践探索[J]. 记者摇篮 2020(06)
    • [16].俄语新闻报道中的术语功能探究[J]. 新闻传播 2020(08)
    • [17].突发公共事件中暖新闻报道的探索和思考[J]. 记者摇篮 2020(07)
    • [18].探析新媒体语境下改善法治新闻报道的对策[J]. 新闻传播 2020(06)
    • [19].科技新闻报道框架结构特点与发展展望——以2014—2017年科技新闻报道为例[J]. 沈阳大学学报(社会科学版) 2020(03)
    • [20].战“疫”中,如何写好“战地报道”——对战“疫”新闻报道的观察与思考[J]. 新闻传播 2020(05)
    • [21].数据“深加工”:疫情下的数据新闻报道透视[J]. 中国记者 2020(07)
    • [22].粮油新闻报道如何出新出彩[J]. 新闻传播 2020(10)
    • [23].数据新闻在气象新闻报道中的尝试与探索[J]. 新媒体研究 2020(11)
    • [24].主流媒体新闻报道与社会活动联动传播合力探析[J]. 传媒评论 2020(07)
    • [25].新闻报道要善于用故事“说话”[J]. 传媒评论 2020(07)
    • [26].新闻报道里的人性化设计[J]. 西部广播电视 2020(11)
    • [27].《民法典》中“新闻报道”行为的主体[J]. 青年记者 2020(19)
    • [28].新闻报道如何真正体现人文关怀[J]. 新闻研究导刊 2020(15)
    • [29].如何避免新闻报道的本质失实[J]. 中国地市报人 2020(08)
    • [30].新闻报道中如何防范“低级红”“高级黑”[J]. 新闻前哨 2020(09)

    标签:;  ;  ;  ;  ;  

    基于事件的新闻报道分析技术研究
    下载Doc文档

    猜你喜欢