中文语音识别结果文本分类的研究与实现

中文语音识别结果文本分类的研究与实现

论文摘要

语音识别技术的研究始于二十世纪五十年代,经过五十多年的发展,语音识别理论日趋成熟。90年代,随着多媒体时代的来临,语音识别技术进一步成熟,语音识别系统从实验室走向实用。语音识别技术可以运用到语音通信系统、声控电话交换、数据查询、订票系统、宾馆医疗服务、银行服务、计算机控制、工业控制等领域。要想实现这些可能,将语音信号识别出来的文本信息进行分类的工作是必不可缺的。本文从中文语音识别系统的应用出发,在传统的中文文本分类系统框架基础上,实现了基于改进的SVM、KNN和朴素贝叶斯分类算法的中文语音识别文本分类系统,并将语音识别结果文本库分为10个类,1200多个样本,对所构建的系统进行了实验分析。该系统针对语音识别文本已经使用词汇为单位的特点,简化了文本分类的预处理过程,去掉了传统中文文本分类过程中的分词处理。分类构造算法方面,重点研究了支持向量机,比较了SVM的核函数对分类效果的影响,得出径向基核函数具有最好的表现。针对文本库中的样本有混叠和在10个类别中分布不均的情况,偏移支持向量机的分类超平面并且自动优化参数,为正负类样本加权,平衡正负类样本的错分率,提高了支持向量机的推广能力和分类性能。通过实验,分析和比较了不同的特征选择算法。以信息增益(IG)方法进行特征选择能获得最高的查准率、查全率;而采用互信息(MI)方法得到的分类结果非常不理想。还进一步分析比较了三种不同的分类算法,改进的SVM在本分类系统的优势非常明显,而且达到了很高的分类准确率,达到了用做研究平台的要求。

论文目录

  • 摘要
  • Abstract
  • 1 绪论
  • 1.1 研究背景及意义
  • 1.2 文本分类的定义及主要技术
  • 1.3 本文的研究工作
  • 2 理论基础和相关技术
  • 2.1 中文文本分类的一般过程
  • 2.2 中文分词技术
  • 2.3 特征处理和特征表示技术
  • 2.3.1 特征选择
  • 2.3.2 特征提取
  • 2.3.3 特征加权
  • 2.3.4 特征表示
  • 2.4 分类构造算法
  • 2.4.1 决策树
  • 2.4.2 SVM(支持向量机)
  • 2.4.3 贝叶斯分类
  • 2.4.4 KNN(K-近邻算法)
  • 2.4.5 神经网络算法
  • 3 语音识别文本分类系统架构设计
  • 3.1 系统设计目标
  • 3.2 系统设计思想
  • 3.3 语音识别文本分类系统总体设计
  • 4 功能模块的设计和实现
  • 4.1 系统分词
  • 4.1.1 一般中文语音识别系统结构
  • 4.1.2 分词处理优化
  • 4.2 去停用词处理
  • 4.3 文本的特征选择
  • 4.3.1 信息增益(IG)
  • 4.3.2 互信息量(MI)
  • 2统计量(CHI)'>4.3.3 x2统计量(CHI)
  • 4.3.4 期望交叉熵(ECE)
  • 4.3.5 文本证据权重(WET)
  • 4.3.6 特征选择算法的实现
  • 4.4 文本表示——向量空间模型(VSM)
  • 5 分类器构造算法的设计与实现
  • 5.1 统计学习理论和支持向量机
  • 5.1.1 统计学习理论
  • 5.1.2 支持向量机
  • 5.1.3 SVM的多类分类
  • 5.2 SVM分类器的改进与实现
  • 5.2.1 算法改进
  • 5.2.2 参数优化
  • 5.2.3 改进的SVM分类器参数设置界面
  • 5.3 朴素贝叶斯分类
  • 5.4 KNN分类
  • 6 实验结果及分析
  • 6.1 系统界面与实验样本集
  • 6.2 评估指标及标准
  • 6.3 改进的SVM分类结果及分析
  • 6.4 几种分类方法的比较研究
  • 结论
  • 参考文献
  • 附录A 分类系统各模块部分代码
  • 攻读硕士学位期间发表学术论文情况
  • 致谢
  • 相关论文文献

    • [1].语音识别声控小车设计[J]. 中国科技信息 2019(Z1)
    • [2].语音识别大揭秘:计算机如何处理声音?[J]. 中国新通信 2019(04)
    • [3].关于深度学习的语音识别应用研究[J]. 科技经济导刊 2019(12)
    • [4].关于语音识别在空调上的应用与改善[J]. 日用电器 2019(07)
    • [5].语音识别专利技术综述[J]. 河南科技 2019(24)
    • [6].数字语音识别与合成[J]. 电子世界 2019(15)
    • [7].浅谈语音识别[J]. 内蒙古科技与经济 2019(18)
    • [8].基于智能声控需求的语音识别研究[J]. 通讯世界 2019(10)
    • [9].语音识别64年大突破[J]. 机器人产业 2016(06)
    • [10].语音识别为何“叫好不叫座”?[J]. 通信世界 2016(16)
    • [11].语音识别的未来之路[J]. 通信世界 2016(16)
    • [12].动动嘴 让文字自动输入[J]. 电脑爱好者(普及版) 2010(11)
    • [13].带着使命感出发[J]. 英语学习 2017(01)
    • [14].荣威eRX5静态体验 “人性化”语音识别是亮点[J]. 新能源汽车新闻 2017(01)
    • [15].语音识别老祖宗[J]. 经营者(汽车商业评论) 2017(03)
    • [16].智能电视,语音识别或成突破口[J]. 消费指南 2017(05)
    • [17].宝马 用科技打造“未来之家”[J]. 中国汽车市场 2016(11)
    • [18].小学生单词语音识别技能培养研究[J]. 教师博览(科研版) 2017(04)
    • [19].语音识别,或是人工智能下一“风口”[J]. 晚霞 2017(06)
    • [20].端到端语音识别的研究进展与挑战[J]. 中国安防 2020(11)
    • [21].简述语音识别的实现过程[J]. 科技传播 2019(02)
    • [22].基于深度学习的语音识别方法研究[J]. 智能计算机与应用 2019(02)
    • [23].远场语音识别方法研究[J]. 信息技术与标准化 2018(08)
    • [24].基于深度学习的语音识别方法[J]. 电子技术与软件工程 2019(08)
    • [25].石油石化设备巡检小车语音识别与控制系统设计与实现[J]. 电子设计工程 2017(22)
    • [26].语音识别专利技术发展现状与未来趋势[J]. 中国发明与专利 2017(S1)
    • [27].语音识别导航技术综述[J]. 科技视界 2018(22)
    • [28].智能家具语音识别精准度优化仿真[J]. 计算机仿真 2018(11)
    • [29].语谱图傅里叶变换的二字汉语词汇语音识别[J]. 现代电子技术 2017(16)
    • [30].语音识别应用新一轮竞技开启:玩法又要变了[J]. 工业设计 2013(11)

    标签:;  ;  ;  ;  

    中文语音识别结果文本分类的研究与实现
    下载Doc文档

    猜你喜欢