非结构文本最佳近似匹配系统的研究与实现

非结构文本最佳近似匹配系统的研究与实现

论文摘要

随着互联网的迅速普及,人类迅速进入了信息时代,如何能从大量纷繁复杂的信息中找到需要的有用信息,就成为了人们研究的热点。在这些信息中,非结构文本数据是使用最多的,因此就有了非结构化文本近似匹配系统。非结构化文本的近似匹配对于信息的检索,文本分析和挖掘都有重要意义,因此一直是人们研究的重点。由于中文语法和语意的复杂性,使得中文的文本匹配变得异常困难,因此设计一个基于中文的高效、准确的非结构文本匹配系统具有广泛的现实意义。基于此本文研究和实现了一个中文非结构文本最佳近似匹配系统。本文作者的主要研究工作如下:(1)对国内外的研究现状进行了对比分析,针对中文非结构化文本匹配中所涉及的中文分词,文本特征表示与匹配,以及聚类算法等相关技术进行了研究分析和相关描述。(2)针对各种技术的优缺点,结合本文作者参与项目的实际需求,设计了相应的软件功能和系统结构。(3)根据本文设计的方案,提出了基于程序API和基于存储引擎两种实现方案,并对两种方案涉及的相关技术,实现原理和实现方法进行了详细介绍。(4)通过实验,进一步对本文所设计的两种方案的性能进行了比较分析。

论文目录

  • 摘要
  • ABSTRACT
  • 1 绪论
  • 1.1 研究背景
  • 1.2 国内研究现状
  • 1.3 国外研究现状
  • 1.4 本文的研究内容与主要工作
  • 1.5 本文的组织结构
  • 2 关键技术概述
  • 2.1 中文分词方法概述
  • 2.2 文本特征的表示和匹配
  • 2.3 聚类算法在文本匹配算法中的应用
  • 2.4 本章小结
  • 3 系统设计
  • 3.1 系统需求分析
  • 3.2 系统功能设计
  • 3.3 系统结构设计
  • 3.4 系统技术路线
  • 3.5 本章小结
  • 4 系统实现
  • 4.1 基于程序API的实现
  • 4.2 存储引擎技术实现
  • 4.3 两种实现方式的对比
  • 4.4 实现效果
  • 4.5 本章小结
  • 5 实验与分析
  • 5.1 实验环境
  • 5.2 结果分析
  • 6 总结与展望
  • 6.1 总结
  • 6.2 展望
  • 参考文献
  • 攻读硕士学位期间发表的学术论文
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  ;  ;  

    非结构文本最佳近似匹配系统的研究与实现
    下载Doc文档

    猜你喜欢