论文摘要从互联网开始普及以来,如何充分利用大量、不同结构、动态的互联网资源就成为信息时代的核心课题之一。信息检索是给网络用户提供网络知识服务的关键技术。但是目前也面临不能提供很...
论文摘要随着互连网的飞速发展和信息传播手段的不断进步,各种短文本数据已经源源不断地大量涌现,如文章摘要、电子邮件、网上即时消息等。为了更好的应用它们,已有不少统计分类法和机器学...
论文摘要话题模型(Topicmodel)是目前流行的一种图模型(Graphmodel)的.其严格遵守贝叶斯概率框架,是一种完全的贝叶斯模型。话题模型作为一种产生式模型,具有非监...
论文摘要随着计算机技术及网络的迅速发展,可供人们应用的数据量急剧的增长,面对浩瀚的网络资源,人们获取准确的、有用的、个性化的信息成为极大地难题,为了解决这个问题,网络信息挖掘技...
论文摘要我国的互联网经过十年的高速发展,网民规模已达到3.38亿,普及率达到25.5%。网络已成为公众获取信息的主要渠道。在Internet上充斥着的大量信息流中,很大一部分是...
论文摘要随着信息技术尤其是因特网相关技术的发展与成熟,人们可获得的信息越来越多。面对海量信息,一方面是人们对快速、准确且全面获取信息的渴望,另一方面却是信息的杂乱无序。而文本分...
论文摘要随着Internet的快速发展,文本分类已经成为了组织在线信息的核心任务之一,并且成为了许多应用中的关键架构。相对于其他学习算法,SVM在文本的分类中表现出了更优异的性...
论文摘要文本自动分类是信息检索与数据挖掘领域的研究热点与核心技术,近年来得到了广泛的关注和快速的发展。它是信息检索、机器学习和自然语言处理的热点和关键技术之一。近几年,人们开始...
论文摘要随着计算机技术的不断发展和互联网的迅速普及,越来越多的人们开始使用互联网进行信息获取。在如今信息发达的时代,如何从海量的文本信息中获取其丰富的语义知识、如何利用这些语义...
论文摘要文本分类最初是应文本信息检索的要求出现的。文本分类可以使得人们无需逐个浏览文本文件来确认是否是自己所需文本,自动的将文本划分到人们事先指定好的类别域中的正确类别,同时在...
论文摘要特征选择在整个中文文本分类过程中具有重要作用。国内现有的对于特征选择方法的研究主要关注于各特征选择方法在类分布均匀语料集上的分类效果。本文针对中文文本分类中一些特征选择...
论文摘要短文本指的是长度较短,通常不超过100个字符,内容精炼内聚的文本,例如新闻标题和手机短信息都是典型的短文本。由于海量信息资源的出现,采用人工方式进行管理越来越不切实际。...
论文摘要随着互联网的普及,现在政府、企业、家庭都在使用网上的电子资源或者向互联网上发送大量的电子文档,如电子新闻、电子邮件、电子图书等等。由于互联网上电子文档的数量急速膨胀,如...
论文摘要随着因特网的快速发展,人们可以从网络上获取越来越多诸如文本、图片、声音等形式的信息,而半结构化或无结构化的文本信息则是占据了大多数,如何利用文本分类技术对这些信息进行分...
论文摘要随着科技的发展和网络的普及,人们可获得的数据量越来越多,这些数据多数是以文本形式存在的。而这些文本数据大多是比较繁杂的,这就导致了数据量大但信息却比较匮乏的状况。如何从...
论文摘要随着Internet和WWW的迅速发展,Internet上的资源日趋丰富,这使网络成为了全球最大的知识库,为信息资源的共享提供了平台,但同时也使贴近用户原意的信息查询变...
论文摘要文本分类是将自然文本根据内容自动分为预先定义的一个或者几个类别的过程。它作为处理和组织大量文本数据的关键技术,可以在较大程度上解决信息杂乱无章的问题,方便用户准确地定位...
论文摘要随着WWW的迅速发展和普及,人们已经从信息资源匮乏的时代迅速过渡到信息极为丰富的数字化时代。面对网上海量的信息资源,人们很难迅速有效的找到所需的信息。因此,如何合理和有...
论文摘要随着Web信息爆炸式的增长,如何有效的在Web中获取有用的信息已变得及其困难。搜索引擎在信息检索中扮演着重要的作用,已经为人们在日常生活中进行信息检索不可缺少的工具。Y...
论文摘要随着Internet的快速发展,Web已经发展成为一种巨大的、分布式的和共享的信息资源。目前Web数据大都以HTML页面的形式出现。由于HTML描述的数据是一种半结构化...