论文摘要计算机存储和数据库管理技术的飞速发展,收集和管理海量数据成为可能;而计算机和数据库管理技术的普及则降低了与之相关的成本,使之成为现实。面对存储量日益增大的各类数据集,为...
论文摘要决策树分类算法是数据挖掘领域中最为广泛研究和应用的一个课题,其优点是计算量小、速度快、分类准确率高、分类规则容易理解。目前经典的决策树算法有ID3、CART、C4.5、...
论文摘要分类是模式识别、机器学习以及数据挖掘中一项基本而又重要的任务。在众多的分类方法中,贝叶斯分类方法因建立在贝叶斯统计学和贝叶斯网络基础上,能够有效地处理不完整数据,并且具...
论文摘要近年来,随着微阵列技术的快速发展,人们可以在一次实验中同时测量成千上万个基因的表达水平(通过微阵列技术获得的基因表达数据称为微阵列基因表达数据)。这种高通量的技术为基因...
论文摘要随着人类社会和计算机技术的飞速发展,电子数据的积累出现了爆炸式的增长。这些海量的电子数据里面无疑隐藏着丰富的对人类深具价值的知识,而传统的数据分析工具只能利用其中的很少...
论文摘要属性选择的核心思想是要在原属性全集的基础上,通过一定的算法和模型去除那些缺乏识别能力和预测能力的冗余属性,得到的新属性子集在数据挖掘的建模性能上优于使用整个属性集所达到...