论文题目: 基于原料蔗糖份数据挖掘的应用研究
论文类型: 硕士论文
论文专业: 计算机应用技术
作者: 张峰
导师: 鲁周迅
关键词: 甘蔗,数据挖掘,糖份积累模型,聚类分析
文献来源: 南京工业大学
发表年度: 2005
论文摘要: 用于榨糖的蔗糖生产比较特殊:一是甘蔗有别于水稻、小麦等作物,收获对象是植株体内的糖份,直观性不强,需要通过检测判断成熟度:不存在种子休眠现象,收割后糖份呈现快速消耗,不能长时间存储;糖份达到最高值后,会出现糖份被消耗的回糖现象,成熟后必需尽快收割。二是蔗糖生产是工业与农业的结合,经济因素制约了榨糖企业的日榨能力,从而限制了甘蔗的收割必需持续一个较长的时间段;加上品种等方面的差异,存在优化收割的需求。同时,两者的结合使工业能够发挥更多的积极作用,不仅表现在企业对蔗农的资金、技术的支持上,榨糖企业记录的进厂时的糖份数据蕴含着农业生产的大量信息,通过数据挖掘可以将有用的知识反馈给农业生产,尤其是优化收割方面。 数据挖掘的工作就是从大量数据中提取人们所感兴趣的潜在的知识和信息。榨糖企业的按质论价体系产生了大量进厂时的糖份数据,为数据挖掘提供了条件。本文针对甘蔗糖份数据的实际情况,详细介绍了数据挖掘中的三个基本任务:探索性数据分析、预测建模和聚类分析。 在甘蔗糖份的可视化数据探索中,发现了管理疲劳现象,给出了管理疲劳现象的描述及相应的对策。通过可视化数据探索,还发现了各品种之间的优化方法:与现行的先收割糖份最高的甘蔗的做法不同的是,收割相对增产潜力小、较成熟的甘蔗品种可以达到全局最优,能够提高甘蔗总糖份。 甘蔗的糖份积累模型对于估产、确定榨期有着重要的参考作用。二次曲线、分段Logistic曲线是现有文献中出现的两个甘蔗糖份积累的数学模型,哪一种模型更适用于估产是本文预测建模探讨的内容。利用甘蔗糖份数据,采用回归预测的方法分析得出Logistic曲线更适于表达大规模生产条件下的糖份波动。 榨糖企业与种蔗单位的关系可以看作是一种特殊的客户关系,虽然不存在客户获得、客户保持,但是良好的客户管理对于甘蔗收割的优化是有帮助的。聚类分析是客户关系管理中最常用的一种数据挖掘技术。本文采用K平均聚类分析的方法,根据不同周次糖份的高低对甘蔗品种、种植单位进行聚类。依据聚类的特点,为不同时段确定收割重点提供依据,为管理人员研究糖份高低的栽培原因提供了参考,同时也为榨糖企业对种蔗单位的资金、技术的支持提供了决策参考。
论文目录:
摘要
ABSTRACT
目录
第1章 绪论
1.1 前言
1.2 甘蔗
1.3 国内外研究现状
1.4 本文研究的目的
1.5 本文主要工作
第2章 数据挖掘
2.1 引言
2.2 数据挖掘的概念
2.2.1 数据挖掘
2.2.2 可视化数据挖掘
2.2.3 数据挖掘的步骤
2.2.4 数据挖掘工具
2.3 其它相关概念
2.3.1 时序数据的挖掘
2.3.2 回归预测
2.3.3 聚类分析
2.3.4 CRISP-DM过程模型
2.4 小结
第3章 事务分析
3.1 引言
3.2 甘蔗生产的理解
3.2.1 榨糖企业与种蔗单位
3.2.2 收割的主要过程
3.2.3 几个相关概念
3.3 数据理解
3.4 数据挖掘的目标
3.4.1 预测分析
3.4.2 聚类分析
3.5 本章小结
第4章 可视化数据探索
4.1 引言
4.2 数据集的探索
4.3 可视化数据探索
4.3.1 甘蔗糖份曲线趋势变化
4.3.2 不同品种间的糖份差异
4.3.3 不同种蔗单位间的差异
4.4 对管理疲劳现象的可视化分析
4.5 小结
第5章 基于甘蔗糖份的数据挖掘
5.1 引言
5.2 甘蔗糖份的预测模型
5.2.1 收割管理的假设
5.2.2 分析数据的选择
5.2.3 数据预处理
5.2.4 两种曲线模型
5.2.5 模型分析
5.3 对种蔗单位的聚类分析
5.3.1 数据预处理
5.3.2 对种蔗单位的聚类分析
5.3.3 结果分析
5.3.4 进一步的探讨
5.4 本章小结
第6章 结语
6.1 分析结果总结
6.1.1 管理疲劳现象
6.1.2 甘蔗糖份的预测模型
6.1.3 种蔗单位的聚类
6.2 展望
6.2.1 精准农业与甘蔗种植
6.2.2 精准农业与数据挖掘
6.2.3 数据挖掘在蔗糖生产上的展望
参考文献
附录 Clementine数据流部分结点符号说明
成果
致谢
发布时间: 2007-03-23
参考文献
- [1].甘蔗收购管理信息系统开发[D]. 周建林.昆明理工大学2007
- [2].基于计算机视觉的甘蔗种茎切割防伤芽系统的研究[D]. 乔曦.广西大学2013
- [3].基于数据挖掘的心脏疾病诊断研究[D]. 蔡楚华.福州大学2017
- [4].基于JBPM的大数据挖掘服务流程引擎的研究与实现[D]. 高鹏.福州大学2017
- [5].数据挖掘在精准帮扶数据分析中的应用研究[D]. 顾海霞.贵州大学2018
- [6].数据挖掘在CDMA网络分析中的应用[D]. 郑张.福州大学2017
- [7].基于Spark MLlib统一数据挖掘服务平台的研究与实现[D]. 林志群.福州大学2017
- [8].数据挖掘方法在股票选择中的应用研究[D]. 朱小舟.对外经济贸易大学2018
- [9].数据挖掘在电网安全生产监督管理中的应用研究[D]. 卢颖浩.华北电力大学2018
- [10].基于数据挖掘的风电机组健康状态监测研究[D]. 靳昊凡.华北电力大学2018
相关论文
- [1].数据挖掘及其在机车质量控制系统中的应用研究[D]. 李云强.西南交通大学2006
- [2].基于公安信息的数据挖掘应用研究[D]. 许军.南京工业大学2006
- [3].数据挖掘技术在图书馆系统中的应用研究[D]. 周蓓.东南大学2006
- [4].基于数据挖掘技术的消费者购车行为分析[D]. 赵岩.内蒙古工业大学2006
- [5].基于数据挖掘技术的金融机构操作风险研究[D]. 艾林.重庆大学2006
- [6].基于遗传算法的关联规则数据挖掘的应用研究[D]. 薛慧君.天津大学2006
- [7].基于网格的数据挖掘应用研究[D]. 袁明.西安电子科技大学2007
- [8].基于决策树算法的数据挖掘的应用[D]. 呼延琢.西安电子科技大学2007
- [9].分类方法在交通数据挖掘的应用研究[D]. 方烈.上海交通大学2007
- [10].基于学生综合测评系统数据挖掘应用研究[D]. 陈显祥.贵州大学2007