论文摘要在科学技术不断繁荣发展的过程当中,传统的自然科学得以深入细分和发展,新的学科不断产生,学科之间相互渗透融合的趋势逐渐增强,学科发展逐渐趋于综合化、整体化。因此,探究学科...
论文摘要面向web的数据挖掘是一项复杂的技术,Web数据挖掘就是利用数据挖掘技术从网络文档和服务中发现和提取信息。Web上的信息五花八门,传统的Internet由各种类型的服务...
论文摘要在现实世界中,文本是信息最重要的载体,事实上,研究表明信息有80%包含在文本文档中。特别是在互联网上,文本数据广泛地存在于各种形式,如新闻报道、电子图书、研究论文、数字...
论文摘要随着互联网的飞速发展,BBS(即网络论坛)已经成为人们自由发表言论,表达民意的重要平台。政府和网管部门需要利用有效的智能技术,对BBS进行舆情监控,以便及时掌握各个时期...
论文摘要随着Internet的迅速发展,信息爆炸问题也随之产生。由于Internet的开放性、动态性使得用户很难快速、准确的从网上获取所需的信息。因此如何有效的从网络上获取有价...
论文摘要近些年来,在线社会网络OSN(OnlineSocialNetwork)获得了空前的发展,成为了学界术和商业界的重要研究领域。从内容相似性的角度进行OSN的挖掘研究,将是...
论文摘要随着信息技术(IT)的快速发展,我国各行各业的大中小企业纷纷以实施IT项目的方式对企业自身进行信息化改造,从而提高企业的效益,加强市场竞争力,因此IT项目已经成为我国经...
论文摘要本论文将在对比分析并发现现有文本挖掘技术存在不足的基础上,提出改进文本预处理精度的算法。文中涉及的主要技术包括文本收集、文本预处理、处理后的文本的中文分词、预抽取训练样...
论文摘要通过对观测或实验数据的积累和分析来了解对研究对象的行为,是现代科学研究的重要方法。随着科学的发展、技术的进步,人们研究客观世界的范围越来越广。在许多新兴的研究领域,人们...
论文摘要当前,出版的生物医学文献呈指数级增长,成为一座巨大的知识宝库。由于生物医学文献绝大多数都是以文本方式存在,从这座宝库快速有效地进行文本挖掘,提取生物医学知识的需求变得非...
论文摘要九十年代以来,Internet以惊人的速度向前发展,Web作为信息制造、发布、加工与处理的主要平台,出现了海量的、异构的、动态的、半结构化或非结构化的信息资源,并且在这...
论文摘要疾病的发生是遗传因素与环境因素共同作用的结果。发现疾病的致病基因是理解疾病致病原因、协助临床判断及预防诊治的基础,因此寻找疾病基因是后基因时代的重要目标。如何对连锁分析...
论文摘要搜索引擎(Searchengine)是指自动从Internet上搜集信息,经过一定整理以后,提供给用户进行查询的系统。它的出现给用户带来了极大的便利。但随着Intern...
论文摘要本文是针对开发网络监控部门所需的信息监控系统的实际研发过程拟就的。随着Web信息的速度增长,有害信息也随之增加。开发一个方便、快捷的监控系统,以便有效地发现Web网页上...
论文摘要随着Web技术的飞速发展,万维网已经成为世界上最大的资源库,面向Web数据的挖掘与应用成为数据挖掘领域的研究热点。其中,针对Web中大量动态表格形式的行情数据的有效获取...
论文摘要随着Web的不断发展和数据量的增加,Web用户越来越依靠搜索引擎来检索信息。特别是对于企业用户,从Web上搜集信息、感知竞争变化、了解竞争对手动向、制定经营战略和竞争决...
论文摘要数据挖掘和文本挖掘是商业数据处理应用中比较有效的技术和方法,它们同时也是商业数据处理高端技术的代表,而数据处理结果的展示和传递则是商业数据处理的一个完整的解决方案所不可...
论文摘要数据挖掘和文本挖掘是当前信息技术中的一个重要研究领域;将软计算方法之一的遗传算法应用于数据及文本挖掘方法研究,具有较大的理论意义和实用价值。本文研究了基于遗传算法和社会...
论文摘要在基础研究的科研项目管理中,项目的相似性分析是一个基本的管理问题,依据相似性可以对项目进行分类,避免重复申报、重复立项,还可以为相似项目的评审选择合适的同行专家。项目的...
论文摘要互连网和信息技术的飞速发展造成海量的数据积累,其中很大一部分是短文数据,如文章摘要和聊天室的会话。对海量的短文数据进行自动的分析和挖掘,从中获取有价值的隐含知识,已经成...