中文分词论文

  • 基于Nutch的学术搜索引擎的研究与实现

    基于Nutch的学术搜索引擎的研究与实现

    论文摘要近年来,随着计算机技术的飞速发展,互联网已经从各方面影响着人们的工作和生活。为了更好的使用互联网资源,搜索引擎应运而生。但是传统的通用搜索引擎存在着网络覆盖率低、查准率...
  • 网络文本分类技术研究

    网络文本分类技术研究

    论文摘要如今,由于网络技术的发展,使得互联网已成为人们获取信息的主要资源库。但网络的开放性使得网络中充满了各式各样的信息。为了使人们能够迅速从网络中获取到自己感兴趣的信息,如何...
  • 基于Lucene的XML索引与检索

    基于Lucene的XML索引与检索

    论文摘要网络信息和数据的交互形成了信息时代的重要标志,XML得到越来越广泛的应用,随之而来的文档数据迅猛增长使得更新和维护XML文档成为一门重要的课题,为了更好使用XML文档,...
  • 基于lucene的搜索引擎

    基于lucene的搜索引擎

    论文摘要基于Heritrix+Lucene数据库搜索引擎是一种将抓取和索引的技术优势融入到搜索引擎的方法,用户通过查询接口输入关键词,将用户输入字符串根据分词词典进行分词,将根...
  • 文本关联规则挖掘方法研究与应用

    文本关联规则挖掘方法研究与应用

    论文摘要随着互联网的大规模普及和企业信息化程度的提高,文本信息快速积累,人们迫切需要研究出方便有效的工具从大规模文本信息中提取符合需要的简洁、精炼、可理解的知识,文本挖掘就是为...
  • 基于Flex和模糊理论的在线考试智能阅卷系统的研究与应用

    基于Flex和模糊理论的在线考试智能阅卷系统的研究与应用

    论文摘要随着我国教育事业的发展和教育思想的进步,传统的考试方式暴露出越来越多的弊端,无纸化在线考试系统得到了广泛的普及和应用,但还存在许多问题,尤其在智能阅卷领域。目前,针对选...
  • 基于SVM的中文文本自动分类系统的研究与实现

    基于SVM的中文文本自动分类系统的研究与实现

    论文摘要近些年来,随着Internet的迅速发展,出现了大量的自然语言文本,如何在这些信息中提取对我们有用的信息已经成为当前研究的一个热点问题,同时这也是文本自动分类的主要任务...
  • 基于Lucene的全文检索系统的研究与应用

    基于Lucene的全文检索系统的研究与应用

    论文摘要随着互联网技术的普及以及信息化程度的提高,网络上的信息资源急剧增加,且信息形式多种多样。信息检索就是从海量的信息资源中获得用户所需要信息的技术。因此,如何从海量的非结构...
  • Lucene与中文分词技术的研究及应用

    Lucene与中文分词技术的研究及应用

    论文摘要摘要:随着现代信息技术的不断发展,信息检索成为了互联网应用的核心,而全文检索是现代信息检索技术的核心中的核心。与普通检索方式不同,全文检索主要处理非结构化数据,通过索引...
  • 中文自动分词系统的研究与实现

    中文自动分词系统的研究与实现

    论文摘要所谓中文分词,就是将中文语句中的词汇切分出来的过程。由于汉语的书写习惯,汉语语句中词与词之间的标志是隐含的,英文的单词与单词之间有空格,所以不存在分词问题。而中文的每一...
  • 词典与统计相结合的中文分词的研究

    词典与统计相结合的中文分词的研究

    论文摘要随着社会信息化的发展,人们很容易获得海量信息。但是要处理海量信息,靠人工是不可能的,必须依靠计算机的帮助。和西方语言不同,中文中的词与词之间没有明显的切分标志。所以,要...
  • 基于内容化目录的网络资源搜索研究

    基于内容化目录的网络资源搜索研究

    论文摘要伴随着互联网的高速发展,信息的发布与共享超越了时空的限制。人们进入了一个“信息爆炸”的时代,互联网信息的快速膨胀给人们带来了很多网络资源的同时,也带来了寻找信息的困难。...
  • SOM算法的改进及其在中文文本聚类的应用

    SOM算法的改进及其在中文文本聚类的应用

    论文摘要近几十年来,国外学者对英文文本聚类投入了大量研究工作,并取得了些优秀的成果。与英文文本聚类相比,中文文本聚类技术研究和应用起步较晚,文本聚类效果普遍不太理想。针对此现状...
  • 基于拼音标注的中文分词算法研究

    基于拼音标注的中文分词算法研究

    论文摘要随着计算机科学与技术尤其是互联网技术的高速发展,人们日常生活的日新月异,使得互联网上呈现出信息知识大爆炸的势头,信息检索成为人们生活中不可或缺的组成部分。而中文分词技术...
  • 基于MPI的分布式搜索引擎系统研究

    基于MPI的分布式搜索引擎系统研究

    论文摘要伴随着互联网的普及和网络信息的爆炸式增长,人们查阅资料己不是依靠有限范围内的网站来寻找,而是依靠搜索引擎对信息海洋中的海量数据进行访问了。搜索引擎技术已经成为互联网发展...
  • 全文检索与GIS一体化及在应急管理中的应用研究

    全文检索与GIS一体化及在应急管理中的应用研究

    论文摘要GIS技术是国家应急平台的重要支撑技术。应急管理要求应急平台间能够进行有效的信息互动。与应急管理相关的信息载体大量地以文档形式和网页形式存在,由此,客观要求对GIS技术...
  • 基于多级Hash分词的全文搜索引擎的研究

    基于多级Hash分词的全文搜索引擎的研究

    论文摘要中文分词作为现代搜索引擎技术的重要基础,一直以来是人们研究的热点和难点。Lucene是一个成熟、开源的软件项目,是一个高性能的信息检索和查询工具,通过对Lucene源代...
  • 基于lucene的图像搜索

    基于lucene的图像搜索

    论文摘要随着计算机的发展,信息量日益膨胀,在庞杂的信息中获取自己想要的信息变得日益复杂,特别是在搜索本机和网络图像的过程中。针对以上的难题,基于Lucene图像搜索系统使用优秀...
  • 搜索引擎中中文分词与纠错模块的设计与实现

    搜索引擎中中文分词与纠错模块的设计与实现

    论文摘要随着互联网的蓬勃发展,各种应用服务层出不穷,搜索引擎是其中最流行的一种服务,仅次于电子邮件。伴随着搜索引擎的普及,越来越多的人通过使用搜索引擎,获取日常工作和生活中需要...
  • 基于朴素贝叶斯和BP神经网络的中文文本分类问题研究

    基于朴素贝叶斯和BP神经网络的中文文本分类问题研究

    论文摘要随着数据库技术和网络的迅速发展以及数据库管理系统的广泛应用,人们积累的数据越来越多。这些信息大都是文本数据,想从其中迅速有效地获得所需信息是非常困难的事情。这些海量的数...