自动文摘技术的研究与应用

自动文摘技术的研究与应用

论文摘要

随着社会的进步和互联网技术的发展,网络信息量的频繁剧增,当今社会面临着信息大爆炸。当大量的信息像潮水般涌向人们时,传统人工处理信息的手段已经远远不足。为了解决这一问题,科学界提出文摘自动生成的技术。 自动文摘通常被视为自然语言处理的一项任务。文摘是准确全面地反映某一文章中心内容的简洁连贯的短文,与索引相比更能满足信息获取的要求。我国对自动文摘技术的研究目前还在初级阶段,但此技术所具有的重要作用是不可低估的,必将在未来的信息处理领域得到广泛的应用。 本论文基于现阶段的研究现状下,运用统计自然语言处理方法,首先对文章进行自动分词,利用停用词表对分词结果进行过滤,并利用知网(HowNet)获得概念,建立概念向量空间模型。通过计算词语重要度和句子重要度,系统得到一个粗略的文摘。最后再进行冗余计算,得到本文章的文摘。 本文在上述研究的基础上,设计了基于概念向量空间模型的自动文摘系统,实现了机器自动生成文摘的各个模块的功能,证实了本文利用概念统计的方法比基于词频统计的方法得到的文摘,能更准确含概原文章的中心内容。

论文目录

  • 摘要
  • ABSTRACT
  • 目录
  • 第一章 绪论
  • 1.1 自动文摘的研究意义和相关概念
  • 1.1.1 研究意义
  • 1.1.2 文摘相关概念及目的
  • 1.1.3 国内外研究现状
  • 1.2 本课题研究的内容
  • 1.3 本文内容组织
  • 第二章 自动文摘的相关模型
  • 2.1 向量空间模型
  • 2.1.1 文本向量空间表示
  • 2.1.2 特征项选择
  • 2.1.3 特征项权重计算
  • 2.1.4 文本间的相似度度量
  • 2.2 存在的问题
  • 2.3 加权的VSM算法改进
  • 第三章 基于概念向量空间模型关键技术的研究
  • 3.1 自动分词技术的研究
  • 3.1.1 自动分词算法
  • 3.1.2 自动分词歧义问题及初步处理
  • 3.2 知网
  • 3.2.1 知网的特色
  • 3.2.2 义原的提取与考核
  • 3.2.3 知网系统的概貌
  • 3.2.4 基于“知网”的语义相似度计算方法
  • 3.3 关键技术
  • 3.3.1 基于HowNet概念获取
  • 3.3.2 概念重要度计算
  • 3.3.3 基于概念向量空间模型的自动文摘生成
  • 第四章 系统实现与试验分析
  • 4.1 系统实现
  • 4.1.1 系统的主要功能
  • 4.1.2 系统的主要模块设计
  • 4.2 试验分析
  • 4.2.1 内部评测
  • 4.2.2 外部评测
  • 4.3 中文自动文摘研究存在的问题及提出的相关技术
  • 4.3.1 存在的问题
  • 4.3.2 提出的相关技术
  • 第五章 总结
  • 致谢
  • 参考文献
  • 相关论文文献

    • [1].一种面向语义检索的向量空间模型改进方法[J]. 农业网络信息 2012(10)
    • [2].基于跨语言广义向量空间模型的跨语言文档聚类方法[J]. 中文信息学报 2012(02)
    • [3].基于情感向量空间模型的歌词情感分析[J]. 中文信息学报 2010(01)
    • [4].基于本体兴趣特征向量空间模型的社区自组织算法[J]. 系统工程 2009(05)
    • [5].基于向量空间模型的短文本密文检索方法[J]. 计算机工程与设计 2017(11)
    • [6].向量空间模型的信息检索技术[J]. 价值工程 2013(13)
    • [7].概念向量空间模型在智能答疑系统中的应用[J]. 安徽工业大学学报(自然科学版) 2008(02)
    • [8].基于词向量的向量空间模型的改进[J]. 现代计算机(专业版) 2018(36)
    • [9].共现潜在语义向量空间模型的进一步研究[J]. 情报杂志 2017(12)
    • [10].基于向量空间模型结合语义的文本相似度算法[J]. 现代电子技术 2018(11)
    • [11].基于鉴别性向量空间模型的语种识别[J]. 清华大学学报(自然科学版) 2013(06)
    • [12].使用向量空间模型进行信息检索的实现[J]. 华南金融电脑 2008(10)
    • [13].核向量空间模型在电能质量综合评估中的应用[J]. 电力系统保护与控制 2012(01)
    • [14].基于向量空间模型的信息检索技术研究[J]. 现代电子技术 2012(11)
    • [15].一种基于向量空间模型的信息检索算法研究[J]. 通讯世界 2018(09)
    • [16].基于情感特征向量空间模型的中文商品评论倾向分类算法[J]. 计算机应用与软件 2016(08)
    • [17].向量空间模型文本建模的语义增量化改进研究[J]. 现代图书情报技术 2014(10)
    • [18].基于主题标签的在线社区话题发现[J]. 系统工程 2017(07)
    • [19].基于N层向量空间模型和两重过滤方法的文本过滤系统的研究[J]. 科技信息 2009(32)
    • [20].一种基于向量空间模型的主观题批改算法[J]. 计算机与现代化 2008(12)
    • [21].基于层次向量空间模型的用户兴趣建模研究[J]. 现代计算机(专业版) 2010(06)
    • [22].基于向量空间模型的信息检索系统的研究与实现[J]. 长春大学学报 2009(08)
    • [23].基于向量空间模型的问答题智能化评分系统[J]. 电脑知识与技术 2008(01)
    • [24].一种基于词义和词频的向量空间模型改进方法[J]. 计算机应用研究 2019(05)
    • [25].基于向量空间模型的网页过滤分析[J]. 电子技术与软件工程 2016(12)
    • [26].基于N层向量空间模型的装备IETM数据查询[J]. 装甲兵工程学院学报 2015(01)
    • [27].基于向量空间模型中文农业网页分类技术研究[J]. 新疆农业大学学报 2012(02)
    • [28].基于情感向量空间模型的歌曲情感标签预测模型[J]. 中文信息学报 2012(06)
    • [29].基于二维向量空间模型的农业技术智能问答系统研究[J]. 江苏农业科学 2012(07)
    • [30].基于WVTool的文本向量空间模型研究与实现[J]. 电脑编程技巧与维护 2012(05)

    标签:;  ;  ;  ;  

    自动文摘技术的研究与应用
    下载Doc文档

    猜你喜欢