论文摘要
随着互联网络的发展,人们越来越依赖于从互联网络获得知识和信息,这些信息包括文本、音频、视频等丰富的多媒体形式。其中,音频资源作为一种容易被用户接受的信息载体,在互联网络上越来越重要和普遍。音频资源已经成为数字图书馆的重要组成,文本和音频相结合的“听书馆”成为一种新兴的网络服务。但这些组织形式对音频资源的检索是基于文件名或者标签的,而非深入到音频的内容。在这些组织形式中,资源之间是独立的,无法关联阅读。并且他们对用户封闭,普通用户无法方便地提交资源和对内容的反馈。用户在检索某方面知识时,希望能同时获得该主题下的文本、图片和语音资源,并且能对检索结果进行反馈和扩充。 本课题在研究和比较该领域现有的软件平台的前提下,融和实验室在语音关键词识别领域的成果和数字图书馆相关技术,研制一个新的基于音频检索的多元素开放式听书馆系统,该系统能有效检索文本和音频信息,支持信息之间的关联检索,并且该系统对用户是开放的,用户可以修订检索结果,添加资源和索引。本课题针对中国历史文化信息领域实现了LibSonar系统,提供了查询中华历史相关信息和音频资源的服务。 本论文的主要工作在于: 第一、提出了一个新型听书馆系统的构架并描述了它的运作机制。 第二、语音关键词识别技术在听书馆系统中的应用。 第三、将倒排索引技术运用于关联索引和音频关键词索引。 第四、实现了一个针对中华五千年历史信息检索的演示系统。
论文目录
摘要Abstract第1章 绪论1.1 课题背景和研究意义1.2 听书馆介绍1.3 理论和技术背景介绍1.3.1 数字图书馆技术概述1.3.2 语音关键词识别技术概述1.4 LibSonar概述1.5 本文的研究内容和组织结构1.6 本章小结第2章 LibSonar概要设计2.1 LibSonar系统需求分析2.2 LibSonar系统功能描述2.3 LibSonar系统框架设计2.4 LibSonar系统整体部署2.5 LibSonar系统运作流程描述2.5.1 信息录入和管理2.5.2 检索过程2.5.3 用户提交反馈和管理员处理反馈2.6 本章小结第3章 数据存储子系统设计与实现3.1 数据存储子系统架构3.2 原始数据存储3.3 索引数据存储3.3.1 倒排索引技术介绍3.3.2 文件信息数据模块3.3.3 关键词索引信息数据模块3.3.4 历史元素信息数据模块3.4 本章小结第4章 信息管理子系统设计与实现4.1 信息管理子系统架构4.2 通用构件模块4.2.1 系统参数配置子模块4.2.2 数据库管理子模块4.2.3 错误处理子模块4.3 历史元素信息管理模块4.3.1 历史人物信息类设计4.3.2 其他历史元素信息类设计4.4 数据导入批处理模块4.5 语音关键词识别模块4.5.1 关键词识别技术介绍4.5.2 识别引擎训练4.5.3 引擎识别过程4.5.4 识别引擎API4.6 音频文件元信息提取模块4.7 用户反馈处理模块4.8 信息管理子系统界面4.9 本章小结第5章 用户检索和反馈子系统设计与实现5.1 用户检索子系统简介5.2 历史元素信息检模块5.3 用户反馈模块5.4 本章小结第6章 LibSonar系统测试和性能分析6.1 功能模块测试6.2 性能测试6.2.1 关键词识别精度测试6.2.2 检索响应速度测试6.3 本章小结第7章 总结和展望参考文献攻读硕士学位期间主要的研究成果致谢
相关论文文献
标签:音频资源检索论文; 关键词识别论文; 数字图书馆论文; 听书馆论文;
韵河(LibSonar):基于音频内容检索的中华历史文化听书馆
下载Doc文档