音频信息隐藏关键技术研究及识别技术的信息安全应用

论文摘要

二十世纪九十年代以来,随着Internet和多媒体技术的发展,数字化作品呈现出海量的增长势头,其传播量呈指数式扩张.这使得古老的隐写术重新找到了附着的载体,并产生了一新的学科研究方向——信息隐藏,现在,信息隐藏已经是信息安全领域的一个重要关注焦点.数字化音频的信息隐藏是信息隐藏的重要方面。由于数字化音频,特别是数字音乐及语音通信,更贴近大众生活,因而与数字化音频相关的信息隐藏具有良好的应用前景.音频的信息隐藏不但可以被用于机要谍报部门的秘密通信,也可以被用于个人隐私保护、Internet安全利用、数字作品权利保护等民用目的,因而它的研究不但具有实用性和社会经济价值,而且具有国家安全的意义。语音是音频的重要分支,对语音类音频的信息隐藏研究需要结合语音特性的研究,因而不可避免地会与语音识别的知识发生交叉。语音识别技术的方法与成果可以与信息隐藏的研究结合,服务于信息安全的应用范畴。对识别技术及音频信息隐藏的信息安全应用进行探索,研究他们的实用领域和应用场景,对其实现经济价值具有重要意义。本文从信息隐藏的视角来看待语言的交流过程,揭示了语音识别与音频信息隐藏的类比相关性。本文进行了音频信息隐藏的研究及其与语音识别相关的交叉研究,取得了以下的创新性研究成果:1.提出了利用汉语语音端点后冗余的信息隐藏方法。汉语的音节末尾的音素基本都是浊音。在声学处理上浊音可以理解为准周期的脉冲串对声道激励所产生的输出。汉语语音的这个特性被用来做语音的端点检测,以区分“有声和无声”。本文则利用这种端点检测方法,确定语音的时域周期冗余,并利用冗余实现了信息隐藏。2.提出了利用美尔频率倒谱系数(MFCC)的信息隐藏方法。MFCC是语音识别的重要参数。为利用MFCC做隐藏点,本文解决了三个难点:(1).MFCC参数选取准则。(2).如何从改变过的MFCC参数逆向求解对数能量。(3).如何进行美尔频率滤波器组的逆向求解。在此基础上,实现了利用MFCC的信息隐藏。3.提出了一种在高级音频编码AAC中进行信息隐藏的方法。由于AAC过程中存在有使用不同码书进行压缩试算的步骤,因而可以利用比例因子频段内频域量化值经不同霍夫曼码书编码后得到相等的最优长度比特的存在概率,以码书的选择作为0、1比特的隐藏方法.4.利用“绝大多数语音识别系统在嗓音环境中的性能都不可避免地急剧下降”的噪声环境的识别研究结论及汉语发音时长短等特点,构建了汉语语音验证码,为网上银行公共客户登录提供可选择的安全性解决方案,并重点解决了合成速度与WEB应用匹配问题。这是语音识别成果在本文的一个重要信息安全应用。5.成功尝试了音频水印和语音识别的结合应用。在自动语音服务中,用创新点1的方法在自动语音中嵌入水印,客户语音终端通过对水印的检测完成对自动语音的确认,并通过调起语音识别引擎,完成客户语音和自动语音的交互。目前,音频信息隐藏技术的研究还具有非常广阔的空间,特别是针对格式音频媒体的隐藏、结合识别技术的隐藏和结合低码率语音编码技术的隐藏。另外,我们还要加强语音识别和音频信息隐藏的领域应用和综合应用研究。

论文目录

摘要

ABSTRACT

第一章引言

1.1 音频信息隐藏与语音识别技术

1.2 音频信息隐藏与语音识别技术的研究现状

1.3 目前存在的关键问题

1.4 本文选题的意义

1.5 篇章安排

[本章小结]

第二章音频信息隐藏的理论基石

2.1 声音听觉理论

2.1.1 声音概述

2.1.2 韦伯定律敏感性理论

2.1.3 频域和时域掩蔽效应理论

2.1.4 心理声学模型

2.1.4.1 MPEG1心理声学模型-1

2.1.4.2 MPEG-1心理声学模型2

2.2 扩频通信系统模型

2.3 数据压缩相关理论

2.4 音频信息隐藏的性能评价理论

2.5 本文涉及的理论点及选用的隐藏评价指标

[本章小结]

第三章音频应用技术---语音识别与音频信息隐藏研究

3.1 语音识别与音频信息隐藏的关联性

3.2 语音识别的基本方法

3.2.1 语音信号产生模型及分析方法

3.2.1.1 线性预测分析

3.2.1.2 同态处理的倒谱分析

3.2.2 语音信号的预处理

3.2.3 语音信号的特征表示与提取

3.2.4 语音信号的训练

3.2.5 语音识别（相似性度量）的模型

3.2.5.1 欧氏距离比较与动态时间规整DTW

3.2.5.2 隐马尔可夫模型（HMM）

3.2.6 后处理模块

3.3 音频信息隐藏的研究

3.3.1 波表合成类音频的信息隐藏

3.3.2 PCM类音频的信息隐藏

3.3.2.1 LSB方法

3.3.2.2 相位编码方法

3.3.2.3 几种变换域与扩频方法

3.3.2.4 回声隐藏

3.3.2.5 内容适应性的隐藏方案

3.3.3 语音信道的音频的信息隐藏

3.3.3.1 基于PSTN的隐藏

3.3.3.2 基于GSM的隐藏

3.3.4 感知编码的压缩音频的信息隐藏

3.3.4.1 mp3的信息隐藏

3.3.4.2 AAC的压缩隐藏

3.4 存在的不足

[本章小结]

第四章利用汉语语音端点后冗余的信息隐藏方法

4.1 隐藏的基本思路

4.2 隐藏与提取算法

4.3 实验及与其他时域隐藏算法的比较

4.4 对A律和U律的适应分析与处理

4.5 结论

[本章小结]

第五章利用MFCC的信息隐藏

5.1 美尔频率倒谱系数MFCC及其计算

5.2 MFCC用于隐藏的理想化思路

5.3 MFCC用于隐藏的折衷和实际可行的思路

5.4 隐藏算法

5.5 提取算法

5.6 实验效果

5.7 语音隐藏分析

[本章小结]

第六章高级音频编码AAC的一种信息隐藏方法

6.1 AAC编解码过程概述

6.2 已有的AAC信息隐藏概念性方法

6.3 利用频域量化值的统计压缩特性的信息隐藏概念性方法

6.4 利用频域量化值的统计压缩特性的信息隐藏和信息提取

6.5 利用频域量化值的统计压缩特性的信息隐藏实验结果

6.6 对利用频域量化值的统计压缩特性的AAC信息隐藏的隐写分析

[本章小结]

第七章语音识别与信息隐藏的研究成果的信息安全应用

7.1 网上银行公共客户的语音验证码的解决方案

7.1.1 汉语语音验证码

7.1.2 汉语语音验证码的合成

7.1.3 汉语语音验证码速度匹配问题的解决

7.1.4 控件

7.1.5 一个汉语语音验证码的服务系统

7.2 音频水印在自动语音交互中的应用

7.2.1 应用目标

7.2.2 应用方案

7.2.3 完整通信过程及水印内容设计

7.2.4 实验系统设计

7.2.5 总结

[本章小结]

第八章总结与展望

[本章小结]

参考文献

图书文献ISBN号列表

致谢

在读期间发表的学术论文与取得的研究成果

音频信息隐藏关键技术研究及识别技术的信息安全应用

论文摘要

论文目录

相关论文文献

猜你喜欢