多粒度融合的汉语句子主观性和情感分类方法研究

多粒度融合的汉语句子主观性和情感分类方法研究

论文摘要

随着互联网的迅猛发展,特别是Web2.0的兴起,越来越多的人们以网络为媒介发表他们对某个事件或事物的意见和评论。意见挖掘得到了广泛地应用,并引起了自然语言处理等相关领域的极大关注,主观性识别和情感分类是意见挖掘中的两个关键问题,其主要任务就是将文本中人们所表达的意见信息从客观性的信息中识别出来,并确定其情感倾向。这两个问题的解决对意见问答系统、信息抽取、和意见文摘等自然语言处理系统都有着极其重要的意义。本文在统计方法和模糊集合论框架下研究汉语句子的主观性识别和情感分类问题。为了降低问题的复杂性,提高系统性能,本文根据汉语句子的特点分析句子中不同粒度层面的主观性及情感倾向,并以它们为基本任务线路,根据不同层次粒度的融合策略解决汉语句子层面的主观性识别和情感分类问题。具体地讲,本文从如下四个方面进行研究:1.主观性识别是意见挖掘中首先要解决的问题之一。面向大规模开放应用,本文提出了一整套汉语句子主观性识别解决方案,包括:(1)在分析汉语主观性表述的基础上,给出了一种基于Chi-square的主观性特征选择方法;(2)针对汉语主观性意见表述与客观事实表述的差异性,引入情感密度概念,提出一种基于情感密度的汉语句子主观性识别方法;(3)在汉语句子的情感密度的基础上,以句子的情感密度区间为特征,描述了一种情感密度和贝叶斯分类器相融合的汉语句子主观性分类方法。实验结果表明,本文提出的汉语句子主客观分类方法具有较强的适应性,能够有效地将文本中的主观性意见表述从客观性事实陈述中分离出来,并取得了较理想的实验结果。2.词语是构成自然语言的基本单位,其主观性是进一步进行短语和句子主观性分析的基础。针对汉语词语主观性存在的兼类问题和强度问题,本文在计算词语的主观性权重的基础上,提出一种对数线性模型和模糊集合相结合的汉语词语主观性强度学习方法。其基本思想是先采用对数线性模型对语料中的候选主观性词语进行主观性权重预测,然后再在模糊集合的框架下融合词语的主观性权重相关信息,构造词语主观性强度的模糊集合及对应的隶属函数并以此判别词语的主观性强度类别,最后应用于汉语句子的主观性识别之中。实验结果表明,由于引入词语的主观性强度类别,本文方法取得了良好的效果。3.引入汉语词语的结构信息有助于汉语词语的情感倾向预测。针对汉语词语情感倾向难于预测的问题,本文在深入分析了汉语词语结构与词语情感倾向的规律的基础上,针对其中较难分辨的未登录词极性预测问题,将词语中语素等结构特征有效结合,提出了一种统计方法框架下的基于语素的汉语词语情感倾向自动预测方法。并在讨论词汇层面极性预测的基础上,提出了一种基于规则的短语极性计算方法,最后在词语和短语的极性计算基础上,给出了基于阈值法的句子情感分类方法。实验结果表明,与其他方法相比较由于引入句子中多层面的语言信息,本文方法较好的解决了汉语句子情感分类问题。4.本文最后主要研究基于多粒度融合的汉语句子情感分类方法。在深入研究了语素、词语和短语层面的主观性及情感倾向的基础上,针对情感句子表述的隐晦性和模糊性,并结合汉语本身的特点,将上下文的多粒度信息融合并引入到整个句子的情感分类中,提出了一个基于多粒度融合与模糊集合相结合的汉语句子分类方法。实验结果表明,与传统的情感分类方法相比,本文提出的基于模糊集合的多粒度融合的汉语句子情感分类方法,从细粒度到粗粒度较精确的识别了汉语句子中各层次的情感强度及情感倾向,因此明显地提高汉语句子级别的情感分类的精确率和召回率。

论文目录

  • 中文摘要
  • Abstract
  • 第1章 绪论
  • 1.1 引言
  • 1.2 意见挖掘研究的研究现状
  • 1.2.1 主观性识别的研究现状
  • 1.2.2 情感分类的研究现状
  • 1.3 意见挖掘研究存在的主要问题和发展趋势
  • 1.4 意见挖掘研究的研究意义
  • 1.5 本章主要研究内容与组织
  • 第2章 基于情感密度和贝叶斯分类器的汉语句子主观性识别方法
  • 2.1 引言
  • 2.2 汉语句子主观性特征及情感密度计算
  • 2.2.1 中文意见句子的主观性特征
  • 2.2.2 汉语句子情感密度及基于密度阈值的主客观分类
  • 2.2.3 基于情感密度和贝叶斯方法的主观性分类
  • 2.3 实验结果与分析
  • 2.3.1 实验设置
  • 2.3.2 实验结果
  • 2.4 本章小结
  • 第3章 基于汉语词汇主观性强度的汉语句子主客观分类
  • 3.1 引言
  • 3.2 主观性词语的抽取
  • 3.3 基于模糊集合的主观性词语的识别
  • 3.3.1 词语主观性强度集合的隶属函数
  • 3.3.2 区分主观性词语
  • 3.4 基于复合规则的主客观分类
  • 3.5 实验结果与分析
  • 3.5.1 实验设置
  • 3.5.2 实验结果
  • 3.6 本章小结
  • 第4章 基于情感语素的汉语句子情感分类
  • 4.1 引言
  • 4.2 汉语语素词语及短语的情感强度
  • 4.2.1 情感语素抽取
  • 4.2.2 词语的极性计算
  • 4.2.3 短语的极性计算
  • 4.3 情感词的动态极性识别方法
  • 4.4 基于语素的汉语句子的情感分类
  • 4.5 实验结果与分析
  • 4.5.1 实验设置
  • 4.5.2 实验结果
  • 4.6 本章小结
  • 第5章 基于多粒度融合与模糊集合的汉语句子情感分类方法
  • 5.1 引言
  • 5.2 多粒度的句子情感强度计算
  • 5.2.1 汉语语素的情感计算
  • 5.2.2 汉语词语的情感计算
  • 5.2.3 汉语短语的情感计算
  • 5.3 基于情感模糊子集的情感句分类
  • 5.4 实验结果与分析
  • 5.4.1 实验设置
  • 5.4.2 实验结果
  • 5.5 本章小结
  • 结论
  • 参考文献
  • 致谢
  • 攻读硕士学位期间发表的学术论文
  • 相关论文文献

    • [1].谈装饰性绘画中的主观性色彩[J]. 美术教育研究 2020(02)
    • [2].广告语的主观性研究[J]. 安徽广播电视大学学报 2018(04)
    • [3].日常互动会话中立场表达的交互主观性探究[J]. 湘南学院学报 2017(01)
    • [4].镜像神经元和交互主观性[J]. 对外汉语研究 2019(01)
    • [5].中考政治如何引导学生做主观性材料题[J]. 四川教育 2017(09)
    • [6].从语气词看语言的交互主观性——以《小额》“啊”、“啦”为例[J]. 语言历史论丛 2014(00)
    • [7].主观性与强调表达的本质、特征及关系[J]. 北京科技大学学报(社会科学版) 2019(05)
    • [8].能源公司管理的新课题:和80、90后员工共事[J]. 能源 2018(07)
    • [9].美丑辨[J]. 中国艺术 2017(04)
    • [10].主观性色彩在油画创作中的应用[J]. 艺术科技 2017(02)
    • [11].教育评估中的主观性指标及其评判的影响因素研究[J]. 教育科学 2017(03)
    • [12].语言主观性研究视角[J]. 开封教育学院学报 2016(01)
    • [13].东北方言词缀的主观性[J]. 才智 2014(30)
    • [14].“X不像话”及其主观性分析[J]. 现代语文(语言研究版) 2017(05)
    • [15].礼貌策略驱动下的汉语交互主观性考察[J]. 南京师范大学文学院学报 2013(04)
    • [16].汉英语中正情绪类心理动词主观性研究[J]. 绥化学院学报 2013(12)
    • [17].“总”和“老”的主观性研究[J]. 汉语学习 2010(02)
    • [18].语言的主观性研究概览[J]. 外语教学 2010(01)
    • [19].论服务质量的主观性[J]. 中国标准化 2018(23)
    • [20].理解数据:客观性与主观性,事实与价值[J]. 苏州大学学报(教育科学版) 2019(03)
    • [21].“云板书”在教学实践中的主观性评价解析[J]. 中国高等医学教育 2017(08)
    • [22].构式对词项主观性的压制研究[J]. 现代外语 2016(01)
    • [23].主观性对现代会计核算的影响探析[J]. 中国商论 2016(24)
    • [24].语言主观性与认知[J]. 青年作家 2014(22)
    • [25].感悟油画主观性色彩[J]. 青春岁月 2011(10)
    • [26].黛力新治疗慢性主观性头晕的临床研究[J]. 当代医学 2014(22)
    • [27].刍议新闻语言所体现的新闻主观性倾向[J]. 新闻传播 2012(10)
    • [28].西方油画中的主观性色彩[J]. 河北理工大学学报(社会科学版) 2009(05)
    • [29].早期手法复位治疗主观性良性阵发性位置性眩晕的效果[J]. 实用医学杂志 2016(04)
    • [30].从社会学角度探讨人才需求的主观性[J]. 决策探索(下半月) 2016(08)

    标签:;  ;  ;  ;  

    多粒度融合的汉语句子主观性和情感分类方法研究
    下载Doc文档

    猜你喜欢