话题识别与跟踪论文-毛建景,张君君

话题识别与跟踪论文-毛建景,张君君

导读:本文包含了话题识别与跟踪论文开题报告文献综述及选题提纲参考文献,主要关键词:相容商空间,粒度,话题识别,舆情

话题识别与跟踪论文文献综述

毛建景,张君君[1](2019)在《基于粒度商空间下的话题识别与跟踪研究》一文中研究指出文中旨在对自然语言所形成的信息流进行话题识别与跟踪,其目的主要针对网络舆论中出现的新话题进行识别,并实现对已有话题的跟踪研究。基于相容商空间粒度下软聚类算法,实现对话题的识别与跟踪,是舆情分析的关键技术。话题识别与跟踪采用软聚类算法,根据相容关系原理,计算距离函数,使话题呈现一定的层次结构,再利用相容隶属函数实现对边界文本的话题确认,形成注明标注信息的语料。同时,结合基于Ontology情感分类法,计算与情感词汇中的语义相似度,统计目标情感词汇的倾向性权重,建立基于粒度商空间下的话题识别与跟踪模型,有效地促进话题倾向性的研究,最终实现对网络舆情话题的识别与跟踪,为相关部门监管网络舆情、掌握舆论方向提供指导。(本文来源于《计算机技术与发展》期刊2019年07期)

陈智敏[2](2013)在《中文报道关系识别与话题跟踪研究》一文中研究指出随着网络技术飞速发展,网络信息规模急剧增大,提供自动高效的信息处理技术处理大规模新闻信息成为了必然。话题检测与跟踪是以新闻数据流为研究对象,通过对话题的发现、识别和追踪,为用户呈现组织后的话题结果,这对舆情分析,信息调研等工作具有重要意义。本文研究中文的话题检测与跟踪任务中两个子任务即报道关系识别和话题跟踪的相关内容。分析国内外现有处理报道关系识别与话题跟踪技术的现状,为提高报道关系识别和话题跟踪的效果及降低错误识别代价,对相关技术进行改进:针对报道关系识别提出抽取要素关联词对并计算关联词对的相似度的方法对报道的表示模型进行补充;针对话题跟踪,在类别选择的基础上提出一种基于改进KNN的话题跟踪算法。在报道关系识别研究中,根据相关报道的新闻要素基本相同的特点,把报道分成时间、地点、人物和内容四个向量,对其分别使用余弦相似度计算。抽取要素的关键特征词作为关联词对以补充报道的表示模型,并提出计算关联词对的相似度计算方法,为检测报道之间的相关性提供更多的依据。在话题跟踪中,为了解决常用KNN算法计算量大且易受训练样本分布的影响的问题,利用平均权重高的特征表示话题,使用KNN找到K个近邻话题,在K个近邻话题的报道中找到K个近邻报道,计算这K个近邻报道所属话题的平均相似度。动态更新话题模型以降低话题漂移问题的影响。经实验证明,本文针对要素关联词对所提出的方法降低了报道关系检测的丢失率、误报率,减少了约10%的错误识别代价。与传统KNN算法相比,本文改进的KNN算法执行效率提高近1倍,错误识别代价降低了9%,因此,本文所提出的改进的KNN算法具有良好的跟踪效果。(本文来源于《广西大学》期刊2013-06-01)

史仁仁[3](2013)在《网络舆情话题识别与跟踪系统的研究与实现》一文中研究指出在科学技术不断进步和发展的时代,越来越多的人通过网络发布和获取信息、参与讨论和发表自己的意见,于是网络舆情成为政府以及企业重要的信息来源和参考。网络舆情中的热点话题反映了舆论的风向,及时发现网络舆论危机,采取适当的措施控制和引导热点话题的发展,对于构建稳定和谐社会具有重要意义。但是由于网络庞大复杂,网民数量剧增和行为活跃带来的海量信息,加大了热点话题的发现的难度。话题识别和话题跟踪的研究因而受到越来越多的重视,文本学习是话题识别与跟踪技术的基础,人类的语言是复杂的逻辑性强的,文本转化成计算机能够处理的形式会丢失大量的信息,即使文本的最表面和简单的信息转化过后,却又带来新的高维和稀疏的难题,所以话题识别与跟踪的效果一直有个能力上限。文本预处理的质量、特征提取算法的选择、文本聚类和分类算法的选择和改进都会对话题识别与跟踪的结果产生重大影响。本文针对现在使用的话题识别与追踪技术各有所长,而各自适合于不同的环境的情况,综合考虑和选择多种不同算法的来比较话题识别与追踪的结果,选择最佳的算法,设计和实现了网络舆情话题识别与跟踪系统,提供给用户热点话题列表、话题列表中的话题的所有相关报道列表,用户可以选择的需要跟踪的热点话题的列表,用户可以搜索站内热点话题,直观地查看话题聚类分布、话题发展历史热度以及相关信息的可视化图示,此外用户还可以灵活配置和选择适合自身的最优算法或算法组合。本系统具有以下特性:(1)集成性。网络舆情话题识别和跟踪系统为用户提供了话题相关全方位的信息。在话题呈现方面,集成了话题和网页列表,话题类簇分布图,话题发展历史热度图,话题来源分布图,话题实体分布图等;在算法方面,集成了一个算法框架可供选择。(2)交互性。网络舆情话题识别和跟踪系统允许用户主动搜索热点话题;网络舆情话题识别和跟踪系统允许用户自由配置聚类分类策略算法或算法组合,以满足使用条件,达到话题识别和跟踪的最优化。(本文来源于《电子科技大学》期刊2013-03-01)

夏春艳,王敏杰,亓志斌,张伟,李树平[4](2012)在《话题识别与跟踪方法的研究》一文中研究指出话题识别与跟踪旨在实现对新闻媒体信息流中新话题的自动检测以及对已知话题的动态跟踪。本文首先介绍话题识别与跟踪的基本概念、研究任务和相似度计算方法,然后对话题跟踪的方法进行详细论述。(本文来源于《科技致富向导》期刊2012年08期)

郑林,李树平,李胜东,范书平,司巧梅[5](2012)在《话题识别与跟踪技术的发展研究》一文中研究指出话题识别与跟踪是一项面向新闻媒体信息流进行未知话题识别和已知话题跟踪的信息处理技术。本文简要介绍了话题识别与跟踪的基本概念、研究任务和测评技术,详细论述了话题识别与跟踪的方法。(本文来源于《科技致富向导》期刊2012年08期)

王艳茹,温长峰,洪晓蕾[6](2011)在《相容商空间粒度下的话题识别与跟踪》一文中研究指出本课题以话题识别与跟踪为研究内容,根据相容关系集和距离函数形成话题层次结构,利用相容隶属函数对不确定边界文本进行话题确认,形成带有明确话题标注信息的语料。以此建立话题识别与跟踪体系,为相关部门实时、精确掌握网络舆情提供理论支撑和方法指引。(本文来源于《中国管理信息化》期刊2011年14期)

陈学昌,韩佳珍,魏桂英[7](2011)在《话题识别与跟踪技术发展研究》一文中研究指出话题识别与跟踪以大规模新闻流为研究对象,通过监控新闻报道描述的话题,发现新的用户感兴趣的信息并将涉及某个话题的新闻报道组织起来以某种方式呈现给用户。本文首先介绍话题识别与跟踪的主要任务、相关概念和评价方法,然后对话题识别国内外研究现状进行详细论述,最后对话题识别的发展趋势和未来的研究方向进行分析。(本文来源于《中国管理信息化》期刊2011年09期)

税仪冬,瞿有利,黄厚宽[8](2009)在《周期分类和Single-Pass聚类相结合的话题识别与跟踪方法》一文中研究指出针对增量式聚类初始时话题模型不够充分和准确,随处理报道数量增加,误检与漏检的累积效应被放大的问题,提出了周期分类和Single-Pass聚类相结合的话题识别与跟踪方法.首先采用增量式聚类算法进行话题识别与跟踪,当新闻文本每积累到一定程度之后,对已经聚类的报道进行周期分类,使话题簇精度提高,从而提高后续话题识别与跟踪精度.实验表明这种方法是有效的,能够降低漏检率与错检率,减少归一化错误识别代价.(本文来源于《北京交通大学学报》期刊2009年05期)

闵可锐,赵迎宾,刘昕,赵泽宇,闫华[9](2008)在《互联网话题识别与跟踪系统设计及实现》一文中研究指出针对互联网上论坛和新闻网站发布的海量自然语言文本,该文设计一个话题识别与跟踪系统,将海量的数据分类整理并聚合形成各个话题。该系统的核心采用SVM方法进行文本分类,基于知识库和网络流算法实现话题的聚合,测试结果表明,文章分类的正确率达到92%,聚类的正确率达到88%,具有较高的应用价值。(本文来源于《计算机工程》期刊2008年19期)

张珏,刘云[10](2008)在《话题识别与跟踪技术的发展与研究》一文中研究指出话题识别与跟踪旨在实现对新闻媒体信息流中新话题的自动识别以及对已知话题的动态跟踪。目前国内在这方面的研究尚处在起步阶段。本文介绍了话题识别与跟踪的发展历程、基本概念、研究任务、主要技术及评价方法,希望能引起相关研究者对这项研究的关注。(本文来源于《北京电子科技学院学报》期刊2008年02期)

话题识别与跟踪论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

随着网络技术飞速发展,网络信息规模急剧增大,提供自动高效的信息处理技术处理大规模新闻信息成为了必然。话题检测与跟踪是以新闻数据流为研究对象,通过对话题的发现、识别和追踪,为用户呈现组织后的话题结果,这对舆情分析,信息调研等工作具有重要意义。本文研究中文的话题检测与跟踪任务中两个子任务即报道关系识别和话题跟踪的相关内容。分析国内外现有处理报道关系识别与话题跟踪技术的现状,为提高报道关系识别和话题跟踪的效果及降低错误识别代价,对相关技术进行改进:针对报道关系识别提出抽取要素关联词对并计算关联词对的相似度的方法对报道的表示模型进行补充;针对话题跟踪,在类别选择的基础上提出一种基于改进KNN的话题跟踪算法。在报道关系识别研究中,根据相关报道的新闻要素基本相同的特点,把报道分成时间、地点、人物和内容四个向量,对其分别使用余弦相似度计算。抽取要素的关键特征词作为关联词对以补充报道的表示模型,并提出计算关联词对的相似度计算方法,为检测报道之间的相关性提供更多的依据。在话题跟踪中,为了解决常用KNN算法计算量大且易受训练样本分布的影响的问题,利用平均权重高的特征表示话题,使用KNN找到K个近邻话题,在K个近邻话题的报道中找到K个近邻报道,计算这K个近邻报道所属话题的平均相似度。动态更新话题模型以降低话题漂移问题的影响。经实验证明,本文针对要素关联词对所提出的方法降低了报道关系检测的丢失率、误报率,减少了约10%的错误识别代价。与传统KNN算法相比,本文改进的KNN算法执行效率提高近1倍,错误识别代价降低了9%,因此,本文所提出的改进的KNN算法具有良好的跟踪效果。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

话题识别与跟踪论文参考文献

[1].毛建景,张君君.基于粒度商空间下的话题识别与跟踪研究[J].计算机技术与发展.2019

[2].陈智敏.中文报道关系识别与话题跟踪研究[D].广西大学.2013

[3].史仁仁.网络舆情话题识别与跟踪系统的研究与实现[D].电子科技大学.2013

[4].夏春艳,王敏杰,亓志斌,张伟,李树平.话题识别与跟踪方法的研究[J].科技致富向导.2012

[5].郑林,李树平,李胜东,范书平,司巧梅.话题识别与跟踪技术的发展研究[J].科技致富向导.2012

[6].王艳茹,温长峰,洪晓蕾.相容商空间粒度下的话题识别与跟踪[J].中国管理信息化.2011

[7].陈学昌,韩佳珍,魏桂英.话题识别与跟踪技术发展研究[J].中国管理信息化.2011

[8].税仪冬,瞿有利,黄厚宽.周期分类和Single-Pass聚类相结合的话题识别与跟踪方法[J].北京交通大学学报.2009

[9].闵可锐,赵迎宾,刘昕,赵泽宇,闫华.互联网话题识别与跟踪系统设计及实现[J].计算机工程.2008

[10].张珏,刘云.话题识别与跟踪技术的发展与研究[J].北京电子科技学院学报.2008

标签:;  ;  ;  ;  

话题识别与跟踪论文-毛建景,张君君
下载Doc文档

猜你喜欢