基于语义的半结构化文档检索

基于语义的半结构化文档检索

论文题目: 基于语义的半结构化文档检索

论文类型: 硕士论文

论文专业: 计算机科学与技术

作者: 闫学东

导师: 蔡月茹

关键词: 半结构化文档,语义视图,知识文摘

文献来源: 清华大学

发表年度: 2005

论文摘要: 互联网中大量的数据以半结构化文档的形式存在,如何从海量的数据中快速、准确的获取用户真正需要的信息成为新的挑战。利用信息抽取技术从半结构文档中提取出来的语义信息为用户精确查询提供了基础。目前,信息抽取相关技术的研究主要集中在如何从半结构化文档中发现语义信息,而对抽取出的结构化语义信息进行检索(即语义检索)的研究还很少。本文在传统的向量空间检索模型的基础之上,提出了一个针对语义信息精确查询的半结构化文档检索模型。已有的研究通常直接使用传统的全文检索技术代替语义检索,这种方法在文档检索上往往能获得较好的效果,但在结构化的语义数据上,却不能满足用户精确的检索需求。本文提出的检索模型基于一个扩展的向量空间模型,建立文档的结构化语义信息的三层索引结构,给出了语义相似度计算的算法设计和实现。该检索模型能够满足用户多样化的和精确的查询需求。语义信息通常保存在领域专家定义的模式中,普通用户难以理解查询出来的语义信息。本文将领域知识文摘问题定义为将本体描述的语义信息用自然语言进行表述的过程;基于分治策略,提出了一个对语义信息进行本体知识文摘的方法;最后利用嵌套模板实现了该本体知识文摘的算法。基于上述的研究成果,本文实现了基于语义的半结构化文档检索模型,并在原型系统TIPSI中进行了集成测试。实验结果表明,本文提出的基于语义的半结构化文档检索模型和本体知识文摘能够很好的满足用户的多样化精确查询需求。

论文目录:

摘要

Abstract

第1章 引言

1.1 课题背景、目的和意义

1.2 相关概念和技术

1.3 信息检索研究的现状

1.4 论文的组织

第2章 半结构化信息智能处理系统(TIPSI)框架

2.1 TIPSI 系统框架

2.2 基于本体表示的文档摘要生成

2.3 基于语义的半结构化文档检索

2.4 本章小结

第3章 基于语义的半结构化文档检索模型

3.1 引言

3.2 语义索引

3.3 语义检索

3.4 本章小结

第4章 基于本体表示的文档摘要生成

4.1 问题提出

4.2 本体知识文摘算法的设计

4.3 试验和分析

4.4 本章小结

第5章 基于语义的半结构化文档检索原型系统的实现

5.1 基于语义的半结构化文档检索模型体系结构

5.2 信息提取

5.3 三级索引的建立

5.4 系统主界面

5.5 功能设计与实现

5.6 本章小结

第6章 结束语

6.1 总结

6.2 未来工作

致谢

个人简历、 在学期间发表的学术论文与研究成果

发布时间: 2007-03-14

参考文献

  • [1].基于非结构化文档理解的问答技术研究[D]. 梁栋云.北京邮电大学2018
  • [2].半结构化文档中语义信息抽取方法的研究[D]. 李毅.清华大学2004
  • [3].非结构化文档数据抽取与分析系统的设计与实现[D]. 王云鹏.天津大学2012
  • [4].信息检索中结构化文档相关度计算方法的研究[D]. 赵嫣.山东大学2007
  • [5].一个支持协同编辑的结构化文档版本管理系统的设计与实现[D]. 邵伟峰.苏州大学2006
  • [6].面向JSON半结构化文档的聚类技术研究[D]. 刘东威.东南大学2017
  • [7].基于语义Web技术的非结构化文档管理方法研究[D]. 施秀丽.南京航空航天大学2012
  • [8].基于同义词扩展的贝叶斯网络结构化文档检索模型[D]. 陈富节.河北大学2008
  • [9].基于语义网的初中数学的自动语义标注方法研究与实现[D]. 何中山.电子科技大学2014
  • [10].云环境下多安全级别的文档自毁机制研究[D]. 易姝仙.福建师范大学2015

相关论文

  • [1].语义Web在概念检索中的研究与应用[D]. 韦佳.哈尔滨工业大学2006
  • [2].基于语义的网络服务匹配机制的研究与实现[D]. 张钋.清华大学2005
  • [3].关键词抽取和结构化列表包装的方法研究[D]. 许晖.清华大学2005
  • [4].计算机自动诊断中的数据挖掘问题[D]. 劳逆.清华大学2006
  • [5].支持语义查询的P2P网络路由策略研究[D]. 陈德伟.清华大学2006
  • [6].基于语义关联的文本聚类方法[D]. 宋韶旭.清华大学2006
  • [7].基于本体的语义检索技术研究[D]. 郑任儿.华东师范大学2007
  • [8].一种基于本体的语义检索模型[D]. 杨晓淼.哈尔滨工程大学2007
  • [9].基于RDF的语义检索技术研究[D]. 何银俊.河海大学2007
  • [10].半结构化文档中语义信息抽取方法的研究[D]. 李毅.清华大学2004

标签:;  ;  ;  

基于语义的半结构化文档检索
下载Doc文档

猜你喜欢