基于DSP的中文电子阅读系统的研究

基于DSP的中文电子阅读系统的研究

论文摘要

综观语言合成技术的研究已有二百多年的历史,但是真正有实用意义的近代语音合成技术是随着计算机技术和数字信号处理技术的发展而发展起来的,主要是让计算机能够产生高清晰度、高自然度的连续语音。近几十年来国际和国内的研究主要集中在按规则文语转换,即将书面语言转换成口头语言。基于语音数据库的语音合成方法有望进一步提高语音合成的自然度。 因为这是一种采用自然语音波形直接拼接的方法,进行拼接的语音单元是从一个预先录下的自然语音数据库中挑选出来的,因此有可能最大限度地保留语音的自然度。但由此产生了一系列新的需要研究的问题,包括:如何确定语音合成的基元,根据什么准则去挑选合适的基元;韵律参数定量化问题,对数据库进行定标问题;以及如何将统计的方法和规则方法相结合使机器能自动发现和找出所需的语音单元,保证最高的合成语句自然度等等。 本文研究了一种新型的、嵌入式的中文电子阅读器。该中文电子阅读器,充分利用了数字信号处理器一DSP的实时处理图象、实时处理声音的能力。它包含了高集成度的图象传感器模块和语音合成模块。可以实时的扫描图象,将图象中的文字识别出来,并转换成声音。详细设计了此阅读器中的语音合成部分的硬件电路和一些重要的接口驱动程序。着重研究了语音合成原理和方法。为了满足提高合成语音的自然度,丰富合成语音的表现力,降低语音合成技术的复杂度等要求。对常用的TD—PSOLA合成方法进行改进,采用数据挖掘算法对韵律参数进行预测,提高了语音合成的质量。利用聚类的方法,对计算机上的语音合成系统的大语料库进行了裁减,满足便携式阅读系统的要求。最后研制出一个完整的阅读样机,可以验证语音合成的效果。

论文目录

  • 1 绪论
  • 1.1 引言
  • 1.2 研究的现状和发展趋势
  • 1.2.1 研究的现状
  • 1.2.2 语音合成研究的发展趋势
  • 1.3 论文研究的背景及主要内容
  • 1.3.1 研究背景
  • 1.3.2 研究主要内容
  • 2 语音合成技术的研究
  • 2.1 语音合成方法
  • 2.1.1 TTS系统的文本分析和韵律预测
  • 2.1.2 语法分析
  • 2.1.3 韵律分析
  • 2.2 系统采用的合成方法
  • 2.2.1 TD-PSOLA合成方法
  • 2.1.2 TD-PSOLA合成方法改进
  • 2.3 韵律建模
  • 2.3.1 韵律建模的数学描述
  • 2.3.2 基于数据挖掘算法的韵律参数预测
  • 2.4 针对嵌入式系统的语料库的裁减的研究
  • 2.4.1 聚类研究
  • 2.4.2 K一中心点聚类算法
  • 2.4.3 数据预处理
  • 2.4.4 实验结果及分析
  • 3 电子阅读器的设计
  • 3.1 系统总体设计
  • 3.2 系统软硬件设计
  • 3.2.1 系统CPU设计
  • 3.2.2 DSP的I/0综合扩展设计
  • 3.2.3 CIS图象传感器设计
  • 3.2.4 TTS语音合成模块
  • 3.2.5 FPGA设计
  • 4 阅读器系统的实现
  • 4.1 总述
  • 4.2 系统的主要组成部分
  • 4.2.1 系统包含各硬件电路IC主要特点及性能
  • 4.2.2 USB控制器芯片采用Philips公司的PDIUSBD
  • 4.2.3 以太网控制芯片采用RTL8019AS
  • 4.2.4 逻辑电路芯片CPLD采用Xi1inx公司的XC
  • 4.3 具体设计过程
  • 4.3.1 硬件设计方法
  • 4.3.2 软件设计方法
  • 4.3.3 开发工具
  • 4.3.4 系统软件源码
  • 结论
  • 致谢
  • 参考文献
  • 电子阅读系统实物图
  • 相关论文文献

    • [1].基于语音合成的智慧导游系统的研究与设计[J]. 信息技术 2020(02)
    • [2].语音合成技术发展综述与研究现状[J]. 科技风 2017(22)
    • [3].基于语音合成的语音提醒器研究[J]. 通讯世界 2018(09)
    • [4].改进参数控制的可视语音合成方法[J]. 计算机工程与设计 2017(04)
    • [5].语音合成技术在声音修复上的尝试[J]. 现代电影技术 2019(07)
    • [6].基于图片的语音合成研究[J]. 电子制作 2018(14)
    • [7].具有情感表现力的可视语音合成研究综述[J]. 计算机工程与科学 2015(04)
    • [8].情感语音合成综述[J]. 现代计算机(专业版) 2014(20)
    • [9].基于统计机器学习的端到端的语音合成研究[J]. 电子世界 2020(06)
    • [10].基于可视语音合成的3D通信技术研究[J]. 计算机应用研究 2009(11)
    • [11].基于语料库的藏语语音合成单元选择算法[J]. 中文信息学报 2017(05)
    • [12].基于语音合成的非接触式红外温度计[J]. 电子质量 2019(04)
    • [13].基于汉语视频三音素的可视语音合成[J]. 电子与信息学报 2009(12)
    • [14].可训练语音合成在维吾尔文合成中的应用[J]. 信息通信 2008(05)
    • [15].汉语情感语音合成的研究[J]. 科技信息(科学教研) 2008(09)
    • [16].基于多情感说话人自适应的情感语音合成研究[J]. 湘潭大学自然科学学报 2018(04)
    • [17].来了短信自动念[J]. 电脑爱好者(普及版) 2012(10)
    • [18].情感语音合成中韵律参数的基频研究[J]. 小型微型计算机系统 2013(09)
    • [19].基于神经网络的藏语语音合成[J]. 中文信息学报 2019(02)
    • [20].基于WaveNet的端到端语音合成方法[J]. 计算机应用 2019(05)
    • [21].基于规则及N-gram模型的数字数据转换成哈萨克语读音文字的方法[J]. 电脑知识与技术 2017(14)
    • [22].人工智能语音识别英语口语评估路径探讨[J]. 信息记录材料 2019(11)
    • [23].皮肤听声原理在语音合成中的应用研究[J]. 现代电子技术 2020(19)
    • [24].计算机语音合成技术研究及发展方向[J]. 科技与企业 2014(01)
    • [25].基于GSM网络具有语音合成功能系统的设计与实现[J]. 网络安全技术与应用 2015(02)
    • [26].藏语语音合成中语料数据标注规则的设计[J]. 西藏大学学报(自然科学版) 2012(01)
    • [27].一种基于Tacotron 2的端到端中文语音合成方案[J]. 华东师范大学学报(自然科学版) 2019(04)
    • [28].车载语音合成真的很重要,ROHM旗下蓝碧石半导体给出“硬”方案[J]. 中国电子商情(基础电子) 2020(07)
    • [29].简化LSTM的语音合成[J]. 计算机工程与应用 2018(03)
    • [30].计算机语音合成系统的研究与应用[J]. 电声技术 2009(06)

    标签:;  ;  ;  

    基于DSP的中文电子阅读系统的研究
    下载Doc文档

    猜你喜欢