论文摘要
铸坯质量是连铸生产中的最主要的问题之一。铸坯质量缺陷众多,且质量缺陷的影响因素难以把握。铸坯表面和内部的缺陷影响了生产效率,严重时还可能延长铸机停机时间,从而造成生产损失;同时连铸生产中采集到的各种工艺参数值等海量数据中可能隐藏了某些与铸坯质量有关的各种数据和信息,需要进行分析。因此,研究铸坯质量影响因素,找出其中的质量缺陷形成规律,并且进行铸坯质量的统计分析和数据挖掘,从而控制连铸生产工艺有重要的意义。本文采用多元统计分析对生产过程中产生的数据进行分析,建立了多元分析中的主成分分析数学模型和Logistic回归分析数学模型;对生产数据的统计分析获得了对铸坯质量影响最大的因素,是进行数据挖掘进行规则构建的重要依据,并对建立的分析模型进行了验证;应用数据挖掘技术,对海量数据进行数据挖掘和分类,运用数据挖掘中决策树的算法建立数据挖掘中的数据分类模型,同时建立数据仓库,通过数据仓库中的数据文件建立数据映射。根据多元统计分析的结果建立数据仓库中的数据挖掘模型,对生产过程中采集的数据进行数据挖掘和规则构建,得到铸坯质量和生产工艺参数互相影响的决策树规则。文中多元统计采用SPSS统计分析软件进行,数据挖掘采用WEKA软件和ORACLE数据库;利用多元分析结果中对铸坯质量影响比较大的因素作为数据挖掘模型中的维度,进行数据挖掘和分类,构建决策树规则。验证了多元统计分析数学模型和数据仓库数据模型,数据挖掘模型的有效性。研究中对铸坯质量影响比较大的因素进行提取,利用影响因素进行数据挖掘生成决策树规则,并提出了提高铸坯质量的方法。