论文摘要
二十世纪九十年代以来,随着Internet和多媒体技术的发展,数字化作品呈现出海量的增长势头,其传播量呈指数式扩张.这使得古老的隐写术重新找到了附着的载体,并产生了一新的学科研究方向——信息隐藏,现在,信息隐藏已经是信息安全领域的一个重要关注焦点.数字化音频的信息隐藏是信息隐藏的重要方面。由于数字化音频,特别是数字音乐及语音通信,更贴近大众生活,因而与数字化音频相关的信息隐藏具有良好的应用前景.音频的信息隐藏不但可以被用于机要谍报部门的秘密通信,也可以被用于个人隐私保护、Internet安全利用、数字作品权利保护等民用目的,因而它的研究不但具有实用性和社会经济价值,而且具有国家安全的意义。语音是音频的重要分支,对语音类音频的信息隐藏研究需要结合语音特性的研究,因而不可避免地会与语音识别的知识发生交叉。语音识别技术的方法与成果可以与信息隐藏的研究结合,服务于信息安全的应用范畴。对识别技术及音频信息隐藏的信息安全应用进行探索,研究他们的实用领域和应用场景,对其实现经济价值具有重要意义。本文从信息隐藏的视角来看待语言的交流过程,揭示了语音识别与音频信息隐藏的类比相关性。本文进行了音频信息隐藏的研究及其与语音识别相关的交叉研究,取得了以下的创新性研究成果:1.提出了利用汉语语音端点后冗余的信息隐藏方法。汉语的音节末尾的音素基本都是浊音。在声学处理上浊音可以理解为准周期的脉冲串对声道激励所产生的输出。汉语语音的这个特性被用来做语音的端点检测,以区分“有声和无声”。本文则利用这种端点检测方法,确定语音的时域周期冗余,并利用冗余实现了信息隐藏。2.提出了利用美尔频率倒谱系数(MFCC)的信息隐藏方法。MFCC是语音识别的重要参数。为利用MFCC做隐藏点,本文解决了三个难点:(1).MFCC参数选取准则。(2).如何从改变过的MFCC参数逆向求解对数能量。(3).如何进行美尔频率滤波器组的逆向求解。在此基础上,实现了利用MFCC的信息隐藏。3.提出了一种在高级音频编码AAC中进行信息隐藏的方法。由于AAC过程中存在有使用不同码书进行压缩试算的步骤,因而可以利用比例因子频段内频域量化值经不同霍夫曼码书编码后得到相等的最优长度比特的存在概率,以码书的选择作为0、1比特的隐藏方法.4.利用“绝大多数语音识别系统在嗓音环境中的性能都不可避免地急剧下降”的噪声环境的识别研究结论及汉语发音时长短等特点,构建了汉语语音验证码,为网上银行公共客户登录提供可选择的安全性解决方案,并重点解决了合成速度与WEB应用匹配问题。这是语音识别成果在本文的一个重要信息安全应用。5.成功尝试了音频水印和语音识别的结合应用。在自动语音服务中,用创新点1的方法在自动语音中嵌入水印,客户语音终端通过对水印的检测完成对自动语音的确认,并通过调起语音识别引擎,完成客户语音和自动语音的交互。目前,音频信息隐藏技术的研究还具有非常广阔的空间,特别是针对格式音频媒体的隐藏、结合识别技术的隐藏和结合低码率语音编码技术的隐藏。另外,我们还要加强语音识别和音频信息隐藏的领域应用和综合应用研究。
论文目录
摘要ABSTRACT目录第一章 引言1.1 音频信息隐藏与语音识别技术1.2 音频信息隐藏与语音识别技术的研究现状1.3 目前存在的关键问题1.4 本文选题的意义1.5 篇章安排[本章小结]第二章 音频信息隐藏的理论基石2.1 声音听觉理论2.1.1 声音概述2.1.2 韦伯定律敏感性理论2.1.3 频域和时域掩蔽效应理论2.1.4 心理声学模型2.1.4.1 MPEG1心理声学模型-12.1.4.2 MPEG-1心理声学模型22.2 扩频通信系统模型2.3 数据压缩相关理论2.4 音频信息隐藏的性能评价理论2.5 本文涉及的理论点及选用的隐藏评价指标[本章小结]第三章 音频应用技术---语音识别与音频信息隐藏研究3.1 语音识别与音频信息隐藏的关联性3.2 语音识别的基本方法3.2.1 语音信号产生模型及分析方法3.2.1.1 线性预测分析3.2.1.2 同态处理的倒谱分析3.2.2 语音信号的预处理3.2.3 语音信号的特征表示与提取3.2.4 语音信号的训练3.2.5 语音识别(相似性度量)的模型3.2.5.1 欧氏距离比较与动态时间规整DTW3.2.5.2 隐马尔可夫模型(HMM)3.2.6 后处理模块3.3 音频信息隐藏的研究3.3.1 波表合成类音频的信息隐藏3.3.2 PCM类音频的信息隐藏3.3.2.1 LSB方法3.3.2.2 相位编码方法3.3.2.3 几种变换域与扩频方法3.3.2.4 回声隐藏3.3.2.5 内容适应性的隐藏方案3.3.3 语音信道的音频的信息隐藏3.3.3.1 基于PSTN的隐藏3.3.3.2 基于GSM的隐藏3.3.4 感知编码的压缩音频的信息隐藏3.3.4.1 mp3的信息隐藏3.3.4.2 AAC的压缩隐藏3.4 存在的不足[本章小结]第四章 利用汉语语音端点后冗余的信息隐藏方法4.1 隐藏的基本思路4.2 隐藏与提取算法4.3 实验及与其他时域隐藏算法的比较4.4 对A律和U律的适应分析与处理4.5 结论[本章小结]第五章 利用MFCC的信息隐藏5.1 美尔频率倒谱系数MFCC及其计算5.2 MFCC用于隐藏的理想化思路5.3 MFCC用于隐藏的折衷和实际可行的思路5.4 隐藏算法5.5 提取算法5.6 实验效果5.7 语音隐藏分析[本章小结]第六章 高级音频编码AAC的一种信息隐藏方法6.1 AAC编解码过程概述6.2 已有的AAC信息隐藏概念性方法6.3 利用频域量化值的统计压缩特性的信息隐藏概念性方法6.4 利用频域量化值的统计压缩特性的信息隐藏和信息提取6.5 利用频域量化值的统计压缩特性的信息隐藏实验结果6.6 对利用频域量化值的统计压缩特性的AAC信息隐藏的隐写分析[本章小结]第七章 语音识别与信息隐藏的研究成果的信息安全应用7.1 网上银行公共客户的语音验证码的解决方案7.1.1 汉语语音验证码7.1.2 汉语语音验证码的合成7.1.3 汉语语音验证码速度匹配问题的解决7.1.4 控件7.1.5 一个汉语语音验证码的服务系统7.2 音频水印在自动语音交互中的应用7.2.1 应用目标7.2.2 应用方案7.2.3 完整通信过程及水印内容设计7.2.4 实验系统设计7.2.5 总结[本章小结]第八章 总结与展望[本章小结]参考文献图书文献ISBN号列表致谢在读期间发表的学术论文与取得的研究成果
相关论文文献
标签:音频信息隐藏论文; 语音信息隐藏论文; 高级音频编码论文; 美尔频率倒谱系数论文; 语音验证码论文; 音频水印论文; 自动语音论文; 语音识别论文;