中文领域术语自动获取方法的研究

中文领域术语自动获取方法的研究

论文摘要

中文术语自动抽取是中文信息处理中的一项基础性研究课题,在很多领域都有很重要的作用。如在语言学中的自然语言生成、计算词典编撰学、句法分析、语料库语言学研究等,在自然语言处理领域中的机器翻译、信息检索、文本分类、文本摘要、领域本体等领域中都有广泛地应用,特别是针对领域语料而言,术语抽取的作用显得更加重要。目前,国内有许多学者致力于中文术语的自动提取,也提出了一些有效的方法,但是,总体技术水平还不成熟;又因为中文文字具有粘合性的特点,字与字之间不像英文那样用空格隔开,处理过程比英文复杂的多,所以国外的术语提取方法对于中文术语提取也不太适用。因此,自行研制适合于中文的领域术语自动提取方法,对中文信息处理来说具有十分重要的意义。本文正是在这种背景下,对中文领域术语提取进行了比较深入的研究,提出了一种术语自动提取的方法。本文的主要研究工作包括以下几个方面:第一:总结了术语的各种表现特征,分析了各种术语自动获取方法的特点,并对比分析国内外在术语自动抽取领域的研究成果。第二:在分析空间向量模型和词频的基础上提出了一种改进的TFIDP方法,并以此方法进行领域文本的选取,该方法能够从混合文本中选出某一领域的文本,通过实验证明了该方法的有效性。第三:在分析常用的领域术语提取方法和贝叶斯推理的基础上,将贝叶斯推理引入到领域术语提取中,然后研究了贝叶斯推理过程中所用到的计算公式,最后给出了基于贝叶斯推理的领域术语获取过程,并设计了该方法的核心模块。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 课题的研究背景及意义
  • 1.2 国内外研究现状
  • 1.2.1 国外术语获取的研究情况
  • 1.2.2 国内术语获取的研究情况
  • 1.3 主要工作与本文组织
  • 第二章 术语学及术语的相关概念
  • 2.1 术语及术语学的概念
  • 2.2 术语的分类
  • 2.3 术语的特征
  • 2.3.1 术语的结构特征
  • 2.3.2 术语的领域特征
  • 2.3.3 术语的单元性与术语性
  • 2.4 本章小结
  • 第三章 特定领域文本选取的研究
  • 3.1 相关概念
  • 3.2 基于文本相似度的文本领域隶属度计算
  • 3.2.1 向量空间模型VSM
  • 3.2.2 基于VSM的改进的TFIDF方法
  • 3.3 领域文本选取过程的研究
  • 3.3.1 文本预处理
  • 3.3.2 文本表示及领域隶属度计算
  • 3.3.3 领域文本选取过程
  • 3.4 实验与分析
  • 3.4.1 语料预处理
  • 3.4.2 评估策略
  • 3.5 本章小结
  • 第四章 基于贝叶斯推理的领域术语获取方法研究
  • 4.1 领域术语获取的相关研究方法
  • 4.1.1 基于规则的方法
  • 4.1.2 基于统计的方法
  • 4.1.3 基于规则和统计相结合的方法
  • 4.2 贝叶斯推理的研究
  • 4.2.1 贝叶斯推理的过程
  • 4.2.2 贝叶斯推理示例
  • 4.3 相关计算公式研究
  • 4.4 领域术语获取的过程
  • 4.4.1 抽词处理
  • 4.4.2 贝叶斯推理阶段
  • 4.4.3 确定领域术语
  • 4.5 实验与分析
  • 4.5.1 术语获取评价指标
  • 4.5.2 结果与分析
  • 4.6 本章小结
  • 第五章 总结与展望
  • 5.1 全文总结
  • 5.2 展望
  • 致谢
  • 参考文献
  • 硕士期间发表的学术论文
  • 相关论文文献

    • [1].西中文作品[J]. 中国书法 2011(09)
    • [2].《国际中文教育学报》征稿启事[J]. 世界汉语教学 2020(02)
    • [3].2019年国际中文教育大会闭幕[J]. 孔子学院 2020(01)
    • [4].基于文化产业振兴背景的高职院校中文教育研究[J]. 科学咨询(教育科研) 2020(04)
    • [5].印度的中文教育:综述与评估[J]. 南亚东南亚研究 2020(05)
    • [6].紡織月刊[J]. 纺织服装周刊 2018(21)
    • [7].紡織月刊[J]. 纺织服装周刊 2017(44)
    • [8].中文塑造了我的人生[J]. 孔子学院 2018(02)
    • [9].中文版音乐剧的价值和意义[J]. 上海艺术评论 2018(05)
    • [10].基于中英文可比较语料的中文零指代消解[J]. 北京大学学报(自然科学版) 2017(02)
    • [11].增强中文自信 助推中华文化复兴——周善甫的中文观述评[J]. 云南师范大学学报(对外汉语教学与研究版) 2017(02)
    • [12].在邕高校泰国留学生阅读中文书籍现状调查研究与分析[J]. 才智 2017(28)
    • [13].西中文作品欣赏[J]. 美与时代(中) 2014(12)
    • [14].论在外语院系中加强中文课教育的意义[J]. 戏剧之家 2015(10)
    • [15].全家都来学中文[J]. 廉政瞭望(上半月) 2015(10)
    • [16].《高校应用数学学报》第三十卷A辑(中文版)总目次[J]. 高校应用数学学报A辑 2015(04)
    • [17].“厦大中文百年”征稿启事[J]. 厦大中文学报 2020(00)
    • [18].香港中文大学宾馆[J]. 金山 2019(08)
    • [19].香港中文大學[J]. 英语画刊(高级版) 2019(25)
    • [20].中文、悟性和悟性享受[J]. 基础教育论坛 2013(20)
    • [21].中文教育之痛[J]. 教师博览 2010(04)
    • [22].该死的中文秘书台[J]. 教师博览 2011(02)
    • [23].探析文化产业振兴与高校中文教育改革[J]. 长江丛刊 2018(02)
    • [24].唐中文作品[J]. 文化月刊 2015(35)
    • [25].好惨的中文课[J]. 课外阅读 2016(05)
    • [26].一不留神,我要读中文系的博士了[J]. 大学生 2016(17)
    • [27].重建中文之美[J]. 百花洲 2016(01)
    • [28].学中文的骄傲[J]. 快乐作文 2015(Z3)
    • [29].孙中山(银奖)[J]. 上海集邮 2015(S1)
    • [30].我和中文做朋友[J]. 快乐作文 2014(Z5)

    标签:;  ;  ;  ;  

    中文领域术语自动获取方法的研究
    下载Doc文档

    猜你喜欢