评论挖掘中的语义信息抽取

评论挖掘中的语义信息抽取

论文摘要

评论挖掘就是对评论文本的挖掘与分析,包括对文章主客观性的判断和评论褒贬义的判断以及句子层的评论文章基本要素的抽取,如抽取评论对象的名称,特征,评论词以及态度倾向等。评论挖掘是目前自然语言处理领域研究的热点,在商业产品用户反馈分析、政府舆情分析、垃圾邮件过滤、信息安全和自动文摘等领域都有广泛的应用。评论挖掘研究的涉及面很广,包括自然语言处理,机器学习,统计分析等等。本文在对评论挖掘任务,研究意义以及前人在这个领域的研究成果进行了概括介绍后结合实际评论挖掘系统研制着重对其中几项关键技术进行了深入的探讨与分析。本文的主要任务阐述了如何将无结构化的评论语句转化为结构化的评论信息记录,包括产品名称,产品特征,评论词以及情感倾向。本文分4步解决这一任务:1,识别评论对象和评论词,2,抽取评论词与评论对象的关系,3,扩充评论关系对为评论3元组,4,判断情感倾向。文中重点介绍了前面2个步骤,我们对评论对象和评论词的识别采用不同的策略,采用机器学习的方法识别评论对象,实验结果表明结合了分词特征的方法能够有效提高识别的准确率。对于评论关系抽取,我们所采用的方法是将同一句子中共现的评价词与评价对象作为候选集合,应用链式线性条件随机场模型并结合词,词性,语义和位置等特征进行关系抽取。我们所提出的方法一定程度上解决了指代消解以及评价对象遗漏的问题。实验结果表明该方法的F值比取最近评价对象的Baseline方法有了15%的提高,并且发现程度副词能够帮助提高主观性评论关系抽取的性能。最后,阐述了作者在评论挖掘研究过程中的心得体会,并对研究成果进行了总结,对该领域的发展前景进行了展望。

论文目录

  • 摘要
  • Abstract
  • 第一章 引言
  • 1.1 任务背景及介绍
  • 1.2 研究意义和应用领域
  • 1.3 本文的工作
  • 1.4 文本组织结构
  • 第二章 研究背景及相关工作
  • 2.1 评论挖掘相关工作
  • 2.2 命名实体识别
  • 2.2.1 基于规则的方法
  • 2.2.2 自动学习的方法
  • 2.3 关系抽取
  • 第三章 评论语义信息抽取
  • 3.1 系统简介
  • 3.2 模型介绍
  • 3.2.1 条件随机场模型
  • 3.3 评论对象以及评论词识别
  • 3.4 评论关系抽取
  • 3.4.1 特征选取
  • 3.5 评论单元抽取及可视化显示
  • 第四章 实验
  • 4.1 实验数据
  • 4.2 实验结果
  • 4.2.1 评论对象以及评论词识别
  • 4.2.2 评论关系抽取
  • 第五章 总结和展望
  • 参考文献
  • 论文发表情况
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  ;  

    评论挖掘中的语义信息抽取
    下载Doc文档

    猜你喜欢