导读:本文包含了领域词典论文开题报告文献综述及选题提纲参考文献,主要关键词:机器翻译,词典知识,领域个性化
领域词典论文文献综述
刘庆峰,刘晨璇,王亚楠,张为泰,刘俊华[1](2019)在《会议场景下融合外部词典知识的领域个性化机器翻译方法》一文中研究指出会议场景下通过语音识别和机器翻译技术实现从演讲人语音到另外一种语言文字的翻译,对于跨语言信息交流具有重要意义,成为当前研究热点之一。该文针对由于会议行业属性带来的专业术语和行业用语的翻译问题,提出了一种融合外部词典知识的领域个性化方法。具体而言,首先采用联合占位符和拼接融合的编码策略,通过引入外部词典知识,在提升实体词、专业术语词翻译准确率的同时,兼顾翻译结果的流畅性。其次提出基于分类的领域旁支参数个性化自适应策略,在保持通用领域翻译效果的情况下实现会议相关领域翻译质量的提升。最后基于上述方案,设计了一套领域个性化自动训练系统。实验结果表明,在中英体育、商务和医学会议翻译任务上,该系统在不影响通用翻译的情况下,平均提升9.22个BLEU,获得较好翻译效果。(本文来源于《中文信息学报》期刊2019年10期)
刘亚桥,陆向艳,邓凯凯,阮开栋,刘峻[2](2019)在《摄影领域评论情感词典构建方法》一文中研究指出目前少见摄影领域情感词典,且为改善Word2Vec情感词典构建方法词语领域区分度,提出一种改进Word2Vec的摄影领域情感词典构建方法。用TF-IDF训练结果词集及人工摄影情感基础词集对Word2Vec训练结果集进行领域重要程度修正,产生摄影领域情感词集,从大连理工大学情感词汇本体库中选取种子词和情感词集计算情感词的极性和强度,和HowNet情感词典合并形成摄影领域情感词典。实验结果表明,该方法在实际摄影评论数据集上取得了较好的效果。(本文来源于《计算机工程与设计》期刊2019年10期)
徐善山[3](2019)在《基于领域词典和机器学习的影评情感分析》一文中研究指出针对影评文本情感分析准确性不高的问题,本文提出一种基于影评领域词典结合机器学习的情感分析方法。首先,构建完备的影评领域相关词典,如程度副词词典、否定词词典和网络用词词典。然后,利用文本相似度的方法(TSIM)对训练数据集进行去重处理,并提出叁类特征:词性、句法、依存进行选择。最后,利用NB和SVM相结合的分类方法对影评进行情感分类。实现结果表明,该方法相对于仅仅基于传统的机器学习的方法,具有更准确的分类精度。(本文来源于《电脑知识与技术》期刊2019年23期)
张志武,陈国兰[4](2019)在《基于网络语料的特定领域情感词典生成方法研究》一文中研究指出[目的/意义]旨在为构建特定领域情感词典提供参考。[方法/过程]基于同义词词典和基于语料库的特点,提出多元融合的词语关系图构建方法,利用半监督标签传播算法为未标记的词语分配情感极性,并进行实例分析。[结果/结论]该方法在自动生成特定领域词汇上具有优越性。(本文来源于《情报探索》期刊2019年04期)
蒋卫丽,陈振华,邵党国,马磊,相艳[5](2019)在《基于领域词典的动态规划分词算法》一文中研究指出由于中文分词的复杂性,不同专业领域具有不同的词典构造。该文通过隐马尔可夫模型(Hidden Markov model,HMM)中文分词模型对文本信息进行初步分词,并结合相关的搜狗领域词库构建出对应的领域词典,对新词出现进行监控,实时优化更新,从而提出了一种基于领域词典的动态规划分词算法。通过对特定领域的信息进行分词实验,验证了该文提出的分词算法可获得较高的分词准确率与召回率。实验结果表明,基于领域词典的动态规划分词算法与基于领域词典的分词算法相比,准确率和召回率都有提升。基于领域词典的动态规划分词算法与传统的smallseg分词、snailseg分词算法相比,分词召回率和准确率都有提升,分词召回率提升了大约1%,分词准确率提升了大约8%,进一步说明了该文提出的分词算法具有很好的领域适应性。(本文来源于《南京理工大学学报》期刊2019年01期)
蒋翠清,郭轶博,刘尧[6](2019)在《基于中文社交媒体文本的领域情感词典构建方法研究》一文中研究指出【目的】从社交媒体用户生成内容中发现未知情感词,构造领域情感词典,应用于汽车评论的情感分析。【方法】选取HowNet情感词典作为种子,以实际汽车评论作为语料,分别利用PMI和Word2Vec算法识别新词情感极性,根据集成规则对二者识别结果综合判定,通过情感分类实验对比显示本文算法的有效性。【结果】按照该方法构造的情感词典准确率比How Net情感词典提高21.6%,较分别使用PMI和Word2Vec算法构建的词典分别提升3.7%和2.1%,同时正面、负面情感词数量均有大幅增加。【局限】语料来源单一,应用于其他领域具有一定局限性。【结论】该方法构造的情感词典可有效应用于社交媒体文本情感分析。(本文来源于《数据分析与知识发现》期刊2019年02期)
郁圣卫,卢奇,陈文亮[7](2019)在《基于领域情感词典特征表示的细粒度意见挖掘》一文中研究指出细粒度意见挖掘的主要目标是从观点文本中获取情感要素并判断情感倾向。现有方法大多基于序列标注模型,但很少利用情感词典资源。该文提出一种基于领域情感词典特征表示的细粒度意见挖掘方法,使用领域情感词典在观点文本上构建特征表示并将其加入序列标注模型的输入部分。首先构建一份新的电商领域情感词典,然后在电商评论文本真实数据上,分别为条件随机场(CRF)和双向长短期记忆-条件随机场(BiLSTM-CRF)这两种常用序列标注模型设计基于领域情感词典的特征表示。实验结果表明,基于电商领域情感词典的特征表示方法在两种模型上都取得了良好的效果,并且超过其他情感词典。(本文来源于《中文信息学报》期刊2019年02期)
石玉鑫,杨泽青,赵志滨,姚兰[8](2019)在《一种面向商品评价对象挖掘的领域词典构建法》一文中研究指出通过挖掘商品评论中的评价对象,可以得知用户更关心商品哪些方面的属性,从而帮助企业改进商品,帮助用户选择商品。因此,商品评价对象的挖掘具有重要的意义。本文提出了一种用于商品评价对象挖掘的领域词典构建方法:首先基于LDA模型,提出了一种领域基础词典的构建方法;然后,分别提出了基于词汇之间的PMI值和基于依存句法分析的领域词典扩充方法。本文基于京东商城的洗衣液产品真实评论数据集,使用构建的词典分别进行了一级标签评价对象挖掘和二级标签评价对象挖掘的实验。实验结果表明,本文提出的方法在进行评价对象挖掘时具有良好的性能;相比一级标签评价对象,扩充后的词典对二级标签评价对象挖掘的效果有更好的提升。(本文来源于《软件工程》期刊2019年01期)
杨鹏[9](2018)在《基于领域词典与机器学习的中文评论情感分析》一文中研究指出随着互联网日新月异的发展,以微博、论坛和电商为代表的线上平台正在崛起。人们越来越习惯于在这些平台上发表对实事热点的观点以及对产品的使用感受,这一现象使得评论数据爆炸式增长。在这些评论中,大量对于商家、卖家以及政府有价值的情感信息蕴含其中,如何提取并应用这些情感信息使得情感分析应运而生。基于词典的情感分析方法作为情感分析最基础的方法,对于特定领域通常没有非常合适的词典可以使用,其打分规则也有待优化。因此本文基于SO-PMI算法构建了酒店领域情感词典,基于中文语法结构提出一套打分规则。对预处理之后的数据结合多种词典进行情感权值计算,按照打分规则得到句子情感得分从而判断句子情感极性。实验证明,所提出的基于情感词典的情感分析方法有较高的准确率。在中文文本中语境复杂,常常存在一词多义的现象,使得基于情感词典的情感分析方法会产生一定的误差。深度学习作为机器学习的高性能方法,可以在语境复杂的中文文本中有更好的表现力,而取得这样的表现是在构造出优秀的中文词向量的前提下。因此本文基于维基中文数据集,利用Word2Vec工具构造了一套适用于所有中文的词向量。在对比实验中,所构建出的中文词向量具有不错的表现。在取得性能优良的词向量后,本文根据Python第叁方库构建了一个基于LSTM循环神经网络的情感分析模型,利用激活函数Sigmoid作为输出层,采用交叉熵作为损失函数。使用之前训练出的词向量作为模型输入,解决句子级评论文本的情感分析任务。准确率优于传统情感分析方法,提高了情感分析结果。(本文来源于《南京邮电大学》期刊2018-11-14)
胡家珩,岑咏华,吴承尧[10](2018)在《基于深度学习的领域情感词典自动构建——以金融领域为例》一文中研究指出【目的】为特定领域情感分析任务构建一个适用的情感词典。【方法】以金融领域为例,结合语料库和知识库的特点,提出一种全新的构建情感词典的方法:利用词向量方法将文本信息映射到向量空间,借助已有的通用情感词典,自动标引训练语料,按照9:1的比例构建训练集和预测集。使用Python构建深度神经网络分类器,判断特定领域候选情感词的情感极性,构成情感词典。【结果】本文构建的神经网络分类器的训练集准确度为95.02%,预测集准确度为95.00%,同时证明了利用本文方法所构建的情感词典在金融领域中的表现优于其他已有方法。【局限】抽取种子词的方法需要进一步优化。【结论】本文方法解决了训练神经网络分类器中训练语料不足的问题,同时解决了词向量的语义相关性无法区分情感信息的问题。在构建面向特定领域情感词典上具有较好的表现,为该领域其他研究提供参考依据。(本文来源于《数据分析与知识发现》期刊2018年10期)
领域词典论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
目前少见摄影领域情感词典,且为改善Word2Vec情感词典构建方法词语领域区分度,提出一种改进Word2Vec的摄影领域情感词典构建方法。用TF-IDF训练结果词集及人工摄影情感基础词集对Word2Vec训练结果集进行领域重要程度修正,产生摄影领域情感词集,从大连理工大学情感词汇本体库中选取种子词和情感词集计算情感词的极性和强度,和HowNet情感词典合并形成摄影领域情感词典。实验结果表明,该方法在实际摄影评论数据集上取得了较好的效果。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
领域词典论文参考文献
[1].刘庆峰,刘晨璇,王亚楠,张为泰,刘俊华.会议场景下融合外部词典知识的领域个性化机器翻译方法[J].中文信息学报.2019
[2].刘亚桥,陆向艳,邓凯凯,阮开栋,刘峻.摄影领域评论情感词典构建方法[J].计算机工程与设计.2019
[3].徐善山.基于领域词典和机器学习的影评情感分析[J].电脑知识与技术.2019
[4].张志武,陈国兰.基于网络语料的特定领域情感词典生成方法研究[J].情报探索.2019
[5].蒋卫丽,陈振华,邵党国,马磊,相艳.基于领域词典的动态规划分词算法[J].南京理工大学学报.2019
[6].蒋翠清,郭轶博,刘尧.基于中文社交媒体文本的领域情感词典构建方法研究[J].数据分析与知识发现.2019
[7].郁圣卫,卢奇,陈文亮.基于领域情感词典特征表示的细粒度意见挖掘[J].中文信息学报.2019
[8].石玉鑫,杨泽青,赵志滨,姚兰.一种面向商品评价对象挖掘的领域词典构建法[J].软件工程.2019
[9].杨鹏.基于领域词典与机器学习的中文评论情感分析[D].南京邮电大学.2018
[10].胡家珩,岑咏华,吴承尧.基于深度学习的领域情感词典自动构建——以金融领域为例[J].数据分析与知识发现.2018