汉语关键词识别与主题信息提取的研究及应用

汉语关键词识别与主题信息提取的研究及应用

论文摘要

在信息爆炸的当今社会,如何对信息进行有效的分析、处理和提取显得尤为重要,本文讨论的汉语关键词识别和主题检测就是关于这个方面的研究。一、论文系统地介绍了汉语关键词识别的相关理论、解决方案及实验分析。对关键词模型的识别基元作了详细讨论;根据汉语语音和关键词识别的特点,提出了四种比较新颖的废料模型聚类方式,增强了汉语关键词识别系统的实际应用性。二、在汉语主题检测技术的研究中,采用了文本分类理论。详细地分析了文本分类的各种方法,介绍了文本分类所需要建立的向量空间模型、具体分类检测的各个流程及相关步骤等,并通过实验重点分析了主题检测的过程。三、在充分地实验讨论了关键词和主题检测的基础上,最后将关键词识别和主题检测有机地结合了起来,在智能家庭普适计算系统中得到了有效的应用,初步实现了智能家庭普适计算系统智能服务的功能。

论文目录

  • 致谢
  • 中文摘要
  • ABSTRACT
  • 1 引言
  • 1.1 概述
  • 1.1.1 关键词识别
  • 1.1.2 文本分类
  • 1.2 国内外研究现状
  • 1.2.1 关键词识别技术的国内外研究现状
  • 1.2.2 文本分类技术的国内外研究现状
  • 1.3 技术挑战
  • 1.4 本文的主要内容及其组织
  • 2 汉语语音和语言理解的基础知识
  • 2.1 汉语语音学基础知识
  • 2.1.1 音素和音节
  • 2.1.2 声母和韵母
  • 2.1.3 声调
  • 2.1.4 汉语普通话的音节结构
  • 2.1.5 汉语普通话的主要特点
  • 2.2 自然语言理解基础知识
  • 2.2.1 词典构造
  • 2.2.2 语法分析
  • 2.2.3 语义分析
  • 2.2.4 篇章分析
  • 3 关键词识别
  • 3.1 关键词识别的几种主要方案及比较
  • 3.1.1 DTW算法
  • 3.1.2 人工神经网络
  • 3.1.3 HMM框架
  • 3.1.4 其他方法
  • 3.1.5 方案比较
  • 3.2 关键词识别研究要解决的问题
  • 3.3 关键词识别的性能评价
  • 3.4 关键词识别的结构
  • 3.5 HMM模型及其相关理论
  • 3.5.1 HMM模型简介
  • 3.5.2 HMM模型的三个基本问题
  • 3.5.3 HMM求解的若干具体问题
  • 3.6 基于HMM框架的关键词识别
  • 3.6.1 基于HMM框架的关键词识别的基本结构
  • 3.6.2 语音信号特性与发声模型
  • 3.6.3 端点检测
  • 3.6.4 预处理
  • 3.6.5 语音特征参数提取
  • 3.6.6 声学模型
  • 3.6.7 关键词识别
  • 3.7 实验结果与分析
  • 4 主题检测
  • 4.1 文本分类概述
  • 4.2 基于统计的中文文本自动分类
  • 4.3 向量空间模型
  • 4.4 分词
  • 4.4.1 基于字符串匹配的分词方法
  • 4.4.2 基于理解的分词方法
  • 4.4.3 基于统计的分词方法
  • 4.5 特征项的抽取
  • 4.6 项的权重计算
  • 4.7 分类算法
  • 4.8 实验分析
  • 5 基于关键词识别及主题检测的智能家庭普适计算系统
  • 5.1 普适计算
  • 5.2 普适计算的特点及体系结构
  • 5.2.1 普适计算的特点
  • 5.2.2 普适计算的体系结构
  • 5.3 基于关键词识别及主题检测的智能家庭普适计算系统的设计
  • 5.4 基于关键词识别及主题检测的智能家庭普适计算系统的实现
  • 结论
  • 参考文献
  • 作者简历
  • 学位论文数据集
  • 相关论文文献

    标签:;  ;  ;  

    汉语关键词识别与主题信息提取的研究及应用
    下载Doc文档

    猜你喜欢