基于语音的机器人控制应用研究

基于语音的机器人控制应用研究

论文摘要

自从工业机器人投入应用以来,它已经在社会生产制造等许多领域中发挥了巨大的作用。目前,各种娱乐、示教、服务类型的机器人正在走进我们的日常生活,它们也将为我们的生活带来很多的方便和乐趣。语音一直是我们日常生活最惯常自然的信息交流方式,实现人机间的语音通信就显得必不可少,进行语音控制的研究工作具有很强的现实意义和应用前景。论文的主要工作是从特定人和非特定人两个方面对机器人语音控制问题进行研究。在特定人的语音识别技术方面,对经典的特定人的语音识别技术(即动态时间规整的语音识别技术,Dynamic Time Warping,简称DTW)进行了深入研究,针对两个方面的问题:1、传统DTW算法在语音识别过程中涉及到大量的计算会影响系统的响应速度;2、由于端点检测方法不能十分精准的判断语音信号的起始点,如果DTW严格对齐端点来匹配则会产生一定的识别误差。对此文章提出了结合搜索宽度限制和放松端点限制的方法对传统DTW算法进行改进,并通过实验验证了改进后的DTW在识别速度和识别率上都有很大的提高。其次,在非特定人语音识别技术方面,文章研究了现行最流行基于隐马尔可夫模型的非特定人语音识别技术。深入分析了算法的产生基础、思想、算法的三个基本问题及相应的解决方法。其中语音训练过程产生的语音模型很大程度上决定了系统的识别性能,因此文章结合了平滑模型参数技术和模型参数重估计方法对语音的模型参数进行了优化改进。实验结果表明对模型参数优化改进后能取得更好的语音识别效果。最后文章说明了机器人动作的设计过程,采用无线蓝牙技术实现了计算机和机器人之间的通讯,使机器人动作控制更具灵活性。在上述工作的基础上,结合VC++6.0和Matlab编程实现了对机器人特定人的语音控制,使用VC++6.0和HTK软件包编程实现了对机器人非特定人的语音控制,测试结果表明两者都达到了对机器人理想的语音控制效果。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 研究背景和意义
  • 1.2 语音识别技术的发展现状
  • 1.3 语音识别系统的分类及性能指标
  • 1.4 本文的主要工作
  • 1.5 论文的组织结构
  • 第二章 语音识别的理论基础
  • 2.1 语音的产生及数字模型
  • 2.2 语音信号处理基础
  • 2.2.1 语音信号的预处理
  • 2.2.2 语音信号的端点检测
  • 2.2.3 语音信号的特征提取
  • 2.3 语音识别技术
  • 2.3.1 特定人的语音识别技术
  • 2.3.2 非特定人的语音识别技术
  • 2.4 本章小结
  • 第三章 基于DTW的特定人语音识别技术研究
  • 3.1 DTW的关键问题
  • 3.2 DTW算法分析
  • 3.3 DTW算法的改进
  • 3.4 实验设计与性能分析
  • 3.4.1 实验设计
  • 3.4.2 性能对比与分析
  • 3.5 本章小结
  • 第四章 基于HMM的非特定人语音识别技术研究
  • 4.1 隐马尔可夫模型(HMM)简介
  • 4.1.1 马尔可夫(Markov)链
  • 4.1.2 HMM的基本思想和定义
  • 4.1.3 HMM的分类
  • 4.2 HMM的基本算法
  • 4.3 模型参数的优化
  • 4.4 实验设计与结果分析
  • 4.4.1 实验工具
  • 4.4.2 实验设计
  • 4.4.3 结果分析
  • 4.5 本章小结
  • 第五章 语音识别技术在机器人控制中的应用
  • 5.1 机器人硬件平台
  • 5.1.1 机器人动作设计与调试
  • 5.2 机器人和上位机之间的通讯
  • 5.2.1 蓝牙通讯技术原理
  • 5.2.2 蓝牙内嵌模块功能和设置
  • 5.3 基于DTW的特定人的机器人语音控制的实现
  • 5.3.1 软件开发平台
  • 5.3.2 机器人特定人的语音控制实现
  • 5.4 基于HMM的非特定人的机器人语音控制的实现
  • 5.4.1 软件开发平台
  • 5.4.2 机器人非特定人的语音控制实现
  • 5.5 本章小结
  • 第六章 结束语
  • 论文总结
  • 课题工作展望
  • 参考文献
  • 致谢
  • 硕士期间发表的论文和参与的课题
  • 相关论文文献

    • [1].基于翻转梅尔频率倒谱系数的语音变调检测方法[J]. 计算机应用 2019(12)
    • [2].语音助手能力评估研究及趋势分析[J]. 广东通信技术 2019(12)
    • [3].语音伪造与鉴伪的发展与挑战[J]. 信息安全学报 2020(02)
    • [4].广告语中语音隐喻的使用规则研究[J]. 传播力研究 2020(03)
    • [5].阻止语音欺诈的7种方法[J]. 计算机与网络 2020(09)
    • [6].5G初期语音业务方案与优化策略[J]. 广西通信技术 2019(03)
    • [7].在线语音直播发展动因探析[J]. 视听 2020(09)
    • [8].语音欺骗检测方法的研究现状及展望[J]. 数据采集与处理 2020(05)
    • [9].5G语音回落4G解决方案探讨[J]. 移动通信 2019(04)
    • [10].手机智能语音助手的发展与未来[J]. 通讯世界 2019(04)
    • [11].语音营销,是新机遇,还是新泡沫?[J]. 营销界 2019(02)
    • [12].语音在少数民族口传音乐中的作用——以赫哲族为例[J]. 北极光 2019(06)
    • [13].古交语音与中古语音的比较[J]. 汉字文化 2019(13)
    • [14].手机语音助手用户体验现状及发展[J]. 内蒙古煤炭经济 2019(15)
    • [15].语音助手市场增长惊人[J]. 董事会 2019(10)
    • [16].在线语音直播的兴起与发展探析[J]. 新闻研究导刊 2018(07)
    • [17].基于噪声分类和字典选择的语音活动检测[J]. 华中科技大学学报(自然科学版) 2016(12)
    • [18].语音拣选系统在汽车零部件首批仓库拣选业务中的应用[J]. 物流技术 2017(01)
    • [19].一种基于语音活动检测的声源定位方法[J]. 电脑知识与技术 2017(04)
    • [20].互联网时代语音业务发展的思考分析[J]. 中国新通信 2017(08)
    • [21].一种基于预测谱偏移的自适应高斯混合模型在语音转换中的应用[J]. 华东理工大学学报(自然科学版) 2017(04)
    • [22].语音中继主叫号码的限制[J]. 通讯世界 2017(18)
    • [23].在线语音直播开启直播新战场[J]. 新闻战线 2017(21)
    • [24].基于同轴的广电语音业务的实现[J]. 中国有线电视 2016(08)
    • [25].瑜伽语音冥想对大学生心理健康的积极影响[J]. 赤子(上中旬) 2014(15)
    • [26].语音感知和语音产出——二语语音习得研究梳辨[J]. 语文学刊(外语教育教学) 2015(04)
    • [27].国内外语语音能力研究论析[J]. 宿州学院学报 2015(06)
    • [28].关于语音转换实现的研究[J]. 价值工程 2015(29)
    • [29].浅析语音导览系统在博物馆中的应用[J]. 学理论 2015(32)
    • [30].语音反馈的实践改进[J]. 教学月刊小学版(综合) 2020(06)

    标签:;  ;  ;  ;  ;  

    基于语音的机器人控制应用研究
    下载Doc文档

    猜你喜欢