论文摘要随着Internet和计算机网络技术的飞速发展,Web已经成为一个海量的、动态的、异构的信息资源库。人们急需从大量的Web数据资源中快速、有效地获取感兴趣的知识和模式。...
论文摘要近年来,随着Internet技术的发展和信息传播手段的进步,人们可以从互联网上得到的信息越来越丰富,尤其可以获得数目惊人的文本文档。如何对这些文档进行有效的导航、总结、...
论文摘要随着网络信息的飞速增长和搜索引擎等技术的日趋成熟,人类社会所面临的主要问题已经不再是信息匮乏,而是如何提高信息获取和信息访问的效率。文本聚类技术具有较强的灵活性和自动处...
论文摘要在现实世界中,文本是信息最重要的载体,事实上,研究表明信息有80%包含在文本文档中。特别是在互联网上,文本数据广泛地存在于各种形式,如新闻报道、电子图书、研究论文、数字...
论文摘要随着国际互联网和企业内部互联网的飞速发展,各种电子文本数据的数量急剧增加,如何快速有效的获取、管理和使用这些文本数据,已经成为信息系统学科迫切需要解决的重要问题。近年来...
论文摘要随着互联网的飞速发展,BBS(即网络论坛)已经成为人们自由发表言论,表达民意的重要平台。政府和网管部门需要利用有效的智能技术,对BBS进行舆情监控,以便及时掌握各个时期...
论文摘要文本聚类是自然语言处理研究中一项重要研究课题,文本聚类技术广泛地应用于信息检索、Web挖掘和数字图书馆等领域。论文介绍了目前国内外文本聚类技术的研究现状,阐述了几种具有...
论文摘要随着互联网技术的飞速发展,网络为我们提供了多元化的海量信息,越来越多的人开始使用搜索引擎来获取所需要的信息。然而,虽然搜索引擎发展迅速,但其效果远未达到令人满意的程度,...
论文摘要随着信息技术在各个领域的普及,各种应用每天产生的数据量呈指数级增长。如何有效处理这些数据,从中提取有用的知识,是迫切需要解决的问题。数据挖掘是为了满足人们对数据中所蕴涵...
论文摘要数据挖掘作为一种知识发现的手段,得到了广泛的应用,是数据库最活跃的领域之一。Web挖掘就是将传统的数据挖掘技术应用到Web环境中,从Web中抽取信息或知识的过程。在We...
论文摘要文本挖掘是指从文本数据中获取可理解的、可用的知识的过程,其涉及数据挖掘、模式识别、信息检索、自然语言处理等多个领域的内容。本文针对文本挖掘中的若干关键问题,例如文本分类...
论文摘要在机器学习领域中,数据的表示方式是其中的核心问题。传统的方法经常通过特征向量的方式将数据表示为高维空间中的点。特征向量的表示方式由于简单直观的特性得到广泛的研究。但是,...
论文摘要随着知识经济的到来,知识管理在社会经济中的作用日益重要。大多数的知识管理研究是为企业服务的,针对科研管理部门的知识管理研究非常少,本文对我国科研管理部门的知识管理问题进...
论文摘要随着互联网和通信技术的发展,InstantMessaging、InternetRelayChat等即时通信工具得到广泛普及和应用。这些即时通信工具往往产生大量的、用于人...
论文摘要随着网络信息的飞速增长,对于文本聚类技术的研究显得更为重要。由于文本数据高维性和稀疏性,传统的文本聚类算法并不能让人满意。IB方法是基于信息论的数据分析方法,该方法通过...
论文摘要数据仓库和数据挖掘是数据库研究、开发和应用最活跃的分支之一。数据挖掘指的是从大型的数据库或数据仓库中提取人们感兴趣的知识,这些知识是隐含的,事先未知的潜在有用信息。数据...
论文摘要随着Internet的飞速发展,对网页文本数据的组织和检索技术,已成为当今国际上研究热点之一。文本聚类作为一种对大规模文本信息进行有效组织、导航、检索和概括汇总的基础、...
论文摘要互连网和信息技术的飞速发展造成海量的数据积累,其中很大一部分是短文数据,如文章摘要和聊天室的会话。对海量的短文数据进行自动的分析和挖掘,从中获取有价值的隐含知识,已经成...
论文摘要随着信息时代的到来和Internet的日益普及,文本信息迅速膨胀。Internet上有数十亿的网页,成千上万TB的数据。而且,每天有数十万的网页更新,数百万的新的网页加...
论文摘要随着Internet的迅速发展,大量信息不断膨胀。如何从大量的信息中提取知识是广大科研工作者研究的重点。而这些信息的多数都是以文本的形式存在的。文本聚类方法作为文本挖掘...