音频检索技术在数字语音教学系统中的应用与研究

论文摘要

数字语音教学系统是语音教学中主要的辅助工具。学生通过数字语音教学系统提供生动形象的英语资料进行学习。实践证明,数字语音教学系统可以有效的调动学生学习英语的兴趣和提高学习效果。为了共享网络资源,数字语音教学系统将局域网内所有教师机的语音资料共享给所有的学生机。虽然学生可以学习的资源丰富了,但是由于学生机存储空间有限,只能存储音频片段。在学习过程中,学生真正需要学习的是音频片段对应的音频原文,但是通过怎样的方式快速高效的根据音频片段检索出原文成为亟待解决的问题。基于内容的音频检索技术的原理是通过提取音频数据的特征信息,从而查找相似音频。因此,数字语音教学系统可以采用音频检索技术检索相似原文。论文中重点研究了音频检索技术在数字语音教学系统中的应用。论文通过对感知哈希和现有相似度匹配模型进行研究,将感知哈希技术与音频检索技术相结合,对现有相似度匹配模型进行改进,提出分段分层感知哈希相似度匹配模型,将被分割音频有效片段作为整体进行粗-细分层匹配,减少了相似度匹配的次数,提高了音频检索的效率。该系统以客户端提供的音频片段作为系统输入,并且将结果以列表形式返回给用户,可以进行实时播放。

论文目录

摘要

Abstract

1 绪论

1.1 研究背景与意义

1.2 国内外研究现状

1.2.1 数字语音教学系统

1.2.2 音频检索技术

1.2.3 感知哈希技术

1.3 研究内容和主要工作

1.4 文本组织结构

2 基于感知哈希的音频检索技术

2.1 引言

2.2 基于内容的音频检索技术

2.2.1 特征提取

2.2.2 检索技术

2.2.3 检索性能评价标准

2.3 音频感知哈希技术

2.3.1 感知哈希概述

2.3.2 感知哈希在音频检索中的应用

2.4 音频感知哈希算法

2.4.1 感知哈希分类

2.4.2 感知哈希算法

2.5 本章小结

3 数字语音教学系统总体介绍

3.1 引言

3.2 系统概述

3.3 系统总体结构

3.3.1 学生机终端结构

3.3.2 教师机终端结构

3.3.3 系统运行模式

3.4 音频检索模块

3.4.1 现有的分段检索技术

3.4.2 音频分段分层感知哈希算法

3.5 本章小结

4 数字语音教学系统中音频检索模块设计

4.1 引言

4.2 音频感知哈希模型设计

4.2.1 音频感知哈希模型构造

4.2.2 音频感知哈希模型建立

4.3 基于感知哈希的音频检索模块设计

4.3.1 音频检索模块总体结构

4.3.2 音频检索模块运行模式

4.3.3 学生机终端功能设计

4.3.4 教师机终端功能设计

4.4 教师机并发处理请求设计

4.5 音频感知哈希检索结果播放设计

4.6 本章小结

5 数字语音教学系统中音频检索模块实现与性能分析

5.1 引言

5.2 系统开发平台介绍

5.2.1 软件平台

5.2.2 硬件平台

5.3 教师机终端的实现

5.3.1 音频特征提取实现

5.3.2 音频感知哈希实现

5.3.3 音频相似度匹配实现

5.3.4 音频特征索引实现

5.4 学生机终端的实现

5.4.1 音频检索学生机端实现

5.4.2 流媒体实时播放实现

5.5 系统界面实现

5.5.1 教师机端操作界面

5.5.2 学生机端用户界面

5.6 性能测试与分析

5.6.1 检索性能

5.6.2 检索速度

5.7 本章小结

6 总结

6.1 论文小结

6.2 有待研究工作

致谢

参考文献

音频检索技术在数字语音教学系统中的应用与研究

论文摘要

论文目录

相关论文文献

猜你喜欢