非结构文本最佳近似匹配系统的研究与实现

论文摘要

随着互联网的迅速普及,人类迅速进入了信息时代,如何能从大量纷繁复杂的信息中找到需要的有用信息,就成为了人们研究的热点。在这些信息中,非结构文本数据是使用最多的,因此就有了非结构化文本近似匹配系统。非结构化文本的近似匹配对于信息的检索,文本分析和挖掘都有重要意义,因此一直是人们研究的重点。由于中文语法和语意的复杂性,使得中文的文本匹配变得异常困难,因此设计一个基于中文的高效、准确的非结构文本匹配系统具有广泛的现实意义。基于此本文研究和实现了一个中文非结构文本最佳近似匹配系统。本文作者的主要研究工作如下：(1)对国内外的研究现状进行了对比分析,针对中文非结构化文本匹配中所涉及的中文分词,文本特征表示与匹配,以及聚类算法等相关技术进行了研究分析和相关描述。(2)针对各种技术的优缺点,结合本文作者参与项目的实际需求,设计了相应的软件功能和系统结构。(3)根据本文设计的方案,提出了基于程序API和基于存储引擎两种实现方案,并对两种方案涉及的相关技术,实现原理和实现方法进行了详细介绍。(4)通过实验,进一步对本文所设计的两种方案的性能进行了比较分析。

论文目录

摘要

ABSTRACT

1 绪论

1.1 研究背景

1.2 国内研究现状

1.3 国外研究现状

1.4 本文的研究内容与主要工作

1.5 本文的组织结构

2 关键技术概述

2.1 中文分词方法概述

2.2 文本特征的表示和匹配

2.3 聚类算法在文本匹配算法中的应用

2.4 本章小结

3 系统设计

3.1 系统需求分析

3.2 系统功能设计

3.3 系统结构设计

3.4 系统技术路线

3.5 本章小结

4 系统实现

4.1 基于程序API的实现

4.2 存储引擎技术实现

4.3 两种实现方式的对比

4.4 实现效果

4.5 本章小结

5 实验与分析

5.1 实验环境

5.2 结果分析

6 总结与展望

6.1 总结

6.2 展望

参考文献

攻读硕士学位期间发表的学术论文

致谢

非结构文本最佳近似匹配系统的研究与实现

论文摘要

论文目录

相关论文文献

猜你喜欢