听觉系统中语音信号处理相关性质研究

论文摘要

随着计算机科学技术的快速发展,计算机信息的处理和判断能力进步迅速,但计算机与人类信息交流却进步较小,使得信息瓶颈问题日益严重。语音技术作为人机接口的重要技术之一,经历了半个多世纪的发展,涌现了许多重大的技术突破。在语音识别、说话人识别和语音合成等诸多领域,已经产生了大量的进入实际应用水平的商业化产品,对社会带来了巨大的变化。但是,现有语音系统在面对实际应用环境时还存在着某些限制。因此,对于人类听觉系统的性质研究,具有非常重要的意义和价值。现有的对听觉系统的大量抗噪性特性研究中,可以按照自下而上和自上而下的分析过程分为两个大类。自下而上分析过程是信号处理系统的基本功能,对声音信号的基本物理特征进行分析和归类;自上而下分析过程则是按照人的意识、注意力和经验等对声音信号的处理进行指导。其中后者作为人类听觉系统和人工系统最显著的区别,是当今听觉研究的热点领域。本研究从三个不同的方面,揭示了人类听觉系统的两个过程中的某些特性。第一个研究通过心理声学实验,发现了人类听觉系统在进行说话人识别过程中,遵循着类似信息论的信息编码方式,而且受到了语言环境的训练带来的影响。第二个研究则通过同样的方式,揭示出人类在进行说话人识别过程中,不同与现有的技术模型,利用了词汇及更长时间尺度上的连续信息。在第三个研究则揭示了在对语音信号分析过程中,除了存在现有理论揭示的分析过程外,还可能存在基于频谱包络结构这样的高级特征作为辅助,更加增强了在某些特殊环境下(如耳语环境)中的识别能力。

论文目录

摘要

Abstract

1 绪论

1.1 自下而上加工过程

1.2 自上而下加工过程

1.3 其他相关研究

1.4 本文研究内容

2 说话人辨识听觉线索研究

2.1 引言

2.2 实验1：不同元音所含音质特征信息测定

2.3 小结

3 文本无关说话人识别心理模型研究

3.1 引言

3.2 实验2：顺/倒序语句判断测试

3.3 小结

4 时频结构检测听觉模型

4.1 引言

4.2 相关定义

4.3 听觉特征检测器模型

4.4 小结

5 总结

致谢

参考文献

附录攻读硕士学位期间发表论文

听觉系统中语音信号处理相关性质研究

论文摘要

论文目录

相关论文文献