韵河(LibSonar):基于音频内容检索的中华历史文化听书馆

韵河(LibSonar):基于音频内容检索的中华历史文化听书馆

论文摘要

随着互联网络的发展,人们越来越依赖于从互联网络获得知识和信息,这些信息包括文本、音频、视频等丰富的多媒体形式。其中,音频资源作为一种容易被用户接受的信息载体,在互联网络上越来越重要和普遍。音频资源已经成为数字图书馆的重要组成,文本和音频相结合的“听书馆”成为一种新兴的网络服务。但这些组织形式对音频资源的检索是基于文件名或者标签的,而非深入到音频的内容。在这些组织形式中,资源之间是独立的,无法关联阅读。并且他们对用户封闭,普通用户无法方便地提交资源和对内容的反馈。用户在检索某方面知识时,希望能同时获得该主题下的文本、图片和语音资源,并且能对检索结果进行反馈和扩充。 本课题在研究和比较该领域现有的软件平台的前提下,融和实验室在语音关键词识别领域的成果和数字图书馆相关技术,研制一个新的基于音频检索的多元素开放式听书馆系统,该系统能有效检索文本和音频信息,支持信息之间的关联检索,并且该系统对用户是开放的,用户可以修订检索结果,添加资源和索引。本课题针对中国历史文化信息领域实现了LibSonar系统,提供了查询中华历史相关信息和音频资源的服务。 本论文的主要工作在于: 第一、提出了一个新型听书馆系统的构架并描述了它的运作机制。 第二、语音关键词识别技术在听书馆系统中的应用。 第三、将倒排索引技术运用于关联索引和音频关键词索引。 第四、实现了一个针对中华五千年历史信息检索的演示系统。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 课题背景和研究意义
  • 1.2 听书馆介绍
  • 1.3 理论和技术背景介绍
  • 1.3.1 数字图书馆技术概述
  • 1.3.2 语音关键词识别技术概述
  • 1.4 LibSonar概述
  • 1.5 本文的研究内容和组织结构
  • 1.6 本章小结
  • 第2章 LibSonar概要设计
  • 2.1 LibSonar系统需求分析
  • 2.2 LibSonar系统功能描述
  • 2.3 LibSonar系统框架设计
  • 2.4 LibSonar系统整体部署
  • 2.5 LibSonar系统运作流程描述
  • 2.5.1 信息录入和管理
  • 2.5.2 检索过程
  • 2.5.3 用户提交反馈和管理员处理反馈
  • 2.6 本章小结
  • 第3章 数据存储子系统设计与实现
  • 3.1 数据存储子系统架构
  • 3.2 原始数据存储
  • 3.3 索引数据存储
  • 3.3.1 倒排索引技术介绍
  • 3.3.2 文件信息数据模块
  • 3.3.3 关键词索引信息数据模块
  • 3.3.4 历史元素信息数据模块
  • 3.4 本章小结
  • 第4章 信息管理子系统设计与实现
  • 4.1 信息管理子系统架构
  • 4.2 通用构件模块
  • 4.2.1 系统参数配置子模块
  • 4.2.2 数据库管理子模块
  • 4.2.3 错误处理子模块
  • 4.3 历史元素信息管理模块
  • 4.3.1 历史人物信息类设计
  • 4.3.2 其他历史元素信息类设计
  • 4.4 数据导入批处理模块
  • 4.5 语音关键词识别模块
  • 4.5.1 关键词识别技术介绍
  • 4.5.2 识别引擎训练
  • 4.5.3 引擎识别过程
  • 4.5.4 识别引擎API
  • 4.6 音频文件元信息提取模块
  • 4.7 用户反馈处理模块
  • 4.8 信息管理子系统界面
  • 4.9 本章小结
  • 第5章 用户检索和反馈子系统设计与实现
  • 5.1 用户检索子系统简介
  • 5.2 历史元素信息检模块
  • 5.3 用户反馈模块
  • 5.4 本章小结
  • 第6章 LibSonar系统测试和性能分析
  • 6.1 功能模块测试
  • 6.2 性能测试
  • 6.2.1 关键词识别精度测试
  • 6.2.2 检索响应速度测试
  • 6.3 本章小结
  • 第7章 总结和展望
  • 参考文献
  • 攻读硕士学位期间主要的研究成果
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  ;  

    韵河(LibSonar):基于音频内容检索的中华历史文化听书馆
    下载Doc文档

    猜你喜欢