论文摘要
近几年,数据分析技术在众多领域取得了显著的应用效果,如金融行业、零售业、电信业、生物学、网络入侵检测等,相应的数据分析工具也日趋成熟:统计分析方向的SPSS、机器学习方向的WEKA,目前微软也在其SQL 2005中加入了数据分析的模块,还有其他应用于特定领域的数据分析工具。在这种趋势下,许多企业也开始利用其多年积累的数据进行与生产、产品等相关的数据分析工作。本文是在多年对配方产品设计、工艺参数和质量控制过程中进行各项数据分析的基础上,总结了一套适用于配方产品数据分析的流程,并对目前配方产品的数据分析应用点及相应的数据分析方法进行了介绍。目前,配方产品(包括饮料、食品、烟草、酒类、中药等)的数据分析需求点集中在配方用农林产品原料的地区、年份、部位等差异性分析;原料内在理化成分之间,以及原料与辅料成分、加工工艺参数与产品质量之间的相关性分析;产品的质量属性与生产过程参数之间的范围估计与预测关系。相应涉及到的分析方法也很多,包括统计学领域的统计量分析、方差分析、逐步线性回归、主成分分析、通径分析、散点图、箱型图等,机器学习领域的M5P决策树、ERP预测树等,还有计算智能领域的RBF网络和BP网络。本文侧重从理论和应用角度阐述几种主要方法,由于不同方法适用于不同的数据分析对象,而且某些数据涉及到企业的机密,所以,某些重点方法的应用效果只给了部分展示。本文是对企业应用项目和长期实践的总结,对配方产品相关行业的数据分析方法研究和实践具有一定的参考价值。
论文目录
摘要Abstract第一章 概论1.1 选题背景及其研究意义1.1.1 选题背景1.1.2 研究意义1.2 配方产品的数据分析现状1.3 论文主要研究内容第二章 数据分析概述2.1 简述2.2 数据分析的流程2.3 数据分析在配方产品中的应用点第三章 数据差异性分析3.1 数据差异性分析概述3.2 数据差异性分析方法3.2.1 聚类分析3.2.2 统计量分析3.2.3 方差分析3.2.4 箱型图3.3 数据差异性分析在配方产品中的应用3.3.1 原料的总体质量分析3.3.2 烟支物理指标的差异性分析第四章 数据相关性分析4.1 数据相关性分析概述4.2 数据相关性分析方法4.2.1 散点图4.2.2 模糊散点图4.2.3 主成分分析4.2.4 简单相关系数4.2.5 逐步线性回归4.2.6 M5P 决策树4.2.7 通径分析4.3 数据相关性分析在配方产品中的应用4.3.1 原料的理化成分与产品质量之间的关系4.3.2 原料的加工工艺与产品质量之间的关系4.3.3 产品物理指标之间的影响关系第五章 数值预测与区间估计5.1 概述5.2 数值预测与区间估计方法5.2.1 模型树与局部加权线性回归5.2.1.1 模型树5.2.1.2 局部加权线性回归5.2.2 时间序列分析5.2.2.1 简单回归分析5.2.2.2 趋势外推法5.2.2.3 指数平滑5.2.3 神经网络预测5.2.3.1 BP 神经网络5.2.3.2 RBF 神经网络5.3 数值预测与区间估计在配方产品中的应用5.3.1 啤酒泡沫稳定性研究中的应用5.3.1.1 M5P 建模分析5.3.1.2 ERP 数值预测与参数区间估计5.3.1.3 时间序列分析5.3.2 烟草感官评估中的应用第六章 结论及展望参考文献致谢个人简历攻读硕士学位期间的学术成果攻读硕士学位期间参与的项目
相关论文文献
标签:差异性分析论文; 相关性分析论文; 数值预测论文; 区间估计论文; 配方论文;