论文摘要
随着Internet的快速发展和网络应用范围的不断扩大,WEB信息量呈指数增长,而传统的搜索引擎仅能从词的层面上来进行搜索,造成人们从WEB信息海洋中及时、全面、准确获取信息越来越困难。本文针对传统的检索技术以及搜索引擎的弊端,对新一代的信息检索系统——基于自然语言理解的搜索引擎进行了研究。这是当前自然语言处理领域一个热门的方向,它同时也代表了将来搜索引擎的发展方向。该类搜索系统综合运用了知识表示、信息检索、自然语言处理等技术,它能够使用户以自然语言输入问题,而不是关键词的组合,大大方便了用户的操作。本文研究了在搜索引擎领域中一些自然语言处理上的相关技术,其中包含对汉语短语的机器识别和对动词谓语句的句法分析等,它们均是利用汉语言自身的语法语义规则来处理汉语言的方法。
论文目录
摘要ABSTRACT1 绪论1.1 课题的研究背景及意义1.2 国内外现状研究1.3 本文的研究内容和组织结构2 搜索引擎概述2.1 概述2.2 搜索引擎的工作原理与系统结构2.2.1 信息采集2.2.2 信息标引2.2.3 索引数据库2.2.4 信息检索2.3 搜索引擎的分类2.3.1 全文搜索引擎2.3.2 目录式搜索引擎2.3.3 元搜索引擎2.3.4 其他非主流搜索引擎形式2.3.5 智能搜索引擎2.4 搜索引擎的检索功能2.4.1 基本检索功能2.4.2 高级检索功能3 自然语言理解的智能搜索关键技术研究3.1 概述3.2 中文自动分词技术3.2.1 引言3.2.2 分词算法研究3.2.3 ICTCLAS 介绍3.3 短语识别技术3.2.1 引言3.2.2 短语规则表3.2.3 语义词典3.2.4 短语识别策略3.4 句法结构分析3.4.1 引言3.4.2 句法分析算法3.5 概念提取与检索扩展3.5.1 引言3.5.2 概念提取3.5.3 概念扩展3.6 文本聚类算法3.6.1 引言3.6.2 聚类算法研究4 自然语言理解的智能搜索系统的分析与设计4.1 概述4.2 需求分析4.3 系统总体设计思路4.3 数据库设计4.4 自然语言理解子系统设计4.5 检索子系统设计5 自然语言理解的智能搜索系统的实现与测试5.1 概述5.2 系统开发与运行环境5.3 表示层实现5.4 逻辑层实现5.5 数据层实现5.6 系统测试6 结论与展望6.1 本文工作总结6.2 未来工作展望致谢参考文献附录
相关论文文献
标签:自然语言理解论文; 搜索引擎论文; 短语识别论文; 句法分析论文;