相似重复记录论文
基于特征优选的数据清洗方法研究
论文摘要现在的社会已经进入了信息时代,正确的决策已成为企业成败的关键。为此很多企业纷纷建立自己的数据仓库,为进一步挖掘数据信息作准备,为企业决策提供有用信息。数据仓库的数据一般...海量数据相似重复记录检测的研究
论文摘要随着数据库技术的快速发展和广泛应用,各行各业积累的数据量越来越大。在建立数据仓库的过程中,需要从各种异构的数据源导入大量的数据。这些数据来源于不同的渠道导致相似重复记录...基于规则的交互式数据清洗技术
论文题目:基于规则的交互式数据清洗技术论文类型:硕士论文论文专业:计算机应用技术作者:孟坚导师:董逸生关键词:数据仓库,数据清洗,数据转换,清洗规则,交互式,领域知识,相似重复...