数据挖掘公式发现FDD.1的算法研究及改进

数据挖掘公式发现FDD.1的算法研究及改进

论文摘要

在科学发展史上,各种物理学、化学、天文学中的自然规律都是科学家对大量的实验数据进行深入的研究得到的,如牛顿三大定律、万有引力定律、开普勒行星运行定律等,这些自然定律是科学发展和社会进步的奠基石。随着计算机的出现,发展了数据拟合技术,它是数值计算的重要分支。数据拟合是利用科学实验中得到的大量测量数据,去求得自变量和因变量的一个近似公式。这种公式统一表示为代数多项式形式,它的系数由最小二乘原理建立正规方程组求出。但是代数多项式存在一个问题,即当它的次数增大时,线性方程组系数行列式将出现“病态”(即行列式元素微小的变化引起解的大变化)。经验公式发现理论FDD(Formula Discovery from Data)是应用人工智能技术的机器发现技术和数据计算中的曲线拟合技术以及可视化技术结合起来自行研制的系统。它是从大量实验数据中发现经验公式,逐步完成任意函数的任意组合,实现对自然规律和经验规律的发现。本文阐述了曲线拟合的基本概念、传统拟合方法、应用及算法的不足等。介绍了基于人工智能的BACON系统和FDD公式发现系统。详细分析了FDD.1公式发现算法,以及在此基础上的另外两个版本FDD.2和FDD.3。本文针对于FDD算法的局限性,总结了算法存在的问题,旨在提高算法的应用范围。对算法的启发式搜索信息进行改进,主要是解决无限循环学习出现的弊端,即无限循环不一定是可行的。在此基础上扩大原型库中函数原型,使算法使用的范围更加广阔。在PC机上对改进的FDD系统进行了实现,并且进行了大量的实验。

论文目录

  • 摘要
  • Abstract
  • 目录
  • 第一章 绪论
  • 1.1 研究的背景及意义
  • 1.1.1 目的、理论价值
  • 1.1.2 课题背景及实际意义
  • 1.2 国内外研究动向
  • 1.3 本文的主要工作
  • 1.4 本文的组织结构
  • 第二章 曲线拟合技术概述
  • 2.1 基本概念
  • 2.2 曲线拟合的方法
  • 2.2.1 最小二乘法
  • 2.2.2 最小二乘法的不足
  • 第三章 数据挖掘中公式发现系统
  • 3.1 人工智能概述
  • 3.2 机器学习概述
  • 3.2.1 机器学习的定义
  • 3.2.2 机器学习系统的基本结构
  • 3.2.3 机器学习方法
  • 3.3 BACON系统
  • 3.4 FDD公式发现系统
  • 3.4.1 FDD.1
  • 3.4.2 FDD.2
  • 3.4.3 FDD.3
  • 3.5 本章小结
  • 第四章 FDD算法的改进与实现
  • 4.1 FDD总体结构图
  • 4.2 FDD算法分析
  • 4.3 改进算法的基本思想
  • 4.3.1 误差下降最快思想
  • 4.3.2 增大原型库中的函数
  • 4.4 本章小结
  • 第五章 实验与分析
  • 5.1 高次多项式与初等函数拟合效果进行比较
  • 5.1.1 使用初等函数拟合的优势
  • 5.1.2 实验结果验证及误差分析
  • 5.2 原FDD.1算法的扩展与分析
  • 5.3 改进思想与算法验证
  • 5.3.1 改进后的FDD算法拟合数据
  • 5.3.2 实验结果验证及误差分析
  • 5.4 扩展函数库,简化算法改进
  • 5.6 本章小结
  • 第六章 总结与展望
  • 参考文献
  • 在学期间作者参加科研与发表论文情况
  • 1、在学期间参加科研项目
  • 2、在学期间发表的学术论文
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  ;  ;  ;  

    数据挖掘公式发现FDD.1的算法研究及改进
    下载Doc文档

    猜你喜欢