改进K均值算法在数据挖掘中的研究应用

改进K均值算法在数据挖掘中的研究应用

论文摘要

数据挖掘是多个领域的交叉学科,用于分析海量数据中的潜在关系以给人们提供有价值的帮助。聚类分析是数据挖掘中的重要技术,它是在无先验知识情况下,按照一定的要求和规律,将数据对象分组成若干个类,使同一个类中的对象有较高的相似度,而不同类中的对象相似度较低。因具有极高的实际应用价值,聚类分析己成为数据挖掘研究中一个非常活跃的研究课题。本文对K均值算法的改进进行了深入细致的研究;在分析模拟退火全局寻优技术和调和平均函数的基础上,研究了基于模拟退火的K均值聚类算法和基于模拟退火的K调和均值聚类算法;分别利用模拟退火技术和调和均值函数使算法来获取全局最优解和减弱算法对初始值的依赖;在对基于模拟退火的K均值算法研究中提出了DK-t0选取法来选取控制参数初始值t0,对基于模拟退火的K调和均值算法研究中提出KH&K结合法;通过对09年高考本科一批理工科提档线数据集聚类效果对比,证明采用DK-t0选取法的基于模拟退火的K均值算法优于随机t0选取法的基于模拟退火的K均值算法;通过对IRIS数据集的聚类,比较了K均值算法、基于模拟退火的K均值算法和基于模拟退火的K调和均值算法的聚类性能;最后将基于模拟退火的K调和均值算法运用于数据挖掘的实例中,对“校讯通”系统数据库进行聚类分析,实现了聚类算法在数据挖掘中的应用。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1-1 课题研究现状
  • 1-1-1 数据挖掘研究现状
  • 1-1-2 K均值算法改进研究
  • 1-2 课题研究的意义
  • 1-3 论文主要内容
  • 1-4 论文结构安排
  • 第二章 数据挖掘及聚类分析理论
  • 2-1 数据挖掘的定义及任务
  • 2-1-1 数据挖掘的定义
  • 2-1-2 数据挖掘的任务
  • 2-2 聚类分析概念及应用
  • 2-2-1 聚类分析定义
  • 2-2-2 聚类分析应用
  • 2-3 聚类分析的原理步骤
  • 2-4 聚类算法的要求
  • 2-5 聚类测度方法和准则函数
  • 2-5-1 聚类分析的相似测度
  • 2-5-2 聚类准则函数
  • 2-6 聚类算法的分类
  • 第三章 基于模拟退火的 K 均值聚类算法
  • 3-1 K 均值算法
  • 3-1-1 K 均值算法的核心思想
  • 3-1-2 K 均值算法流程
  • 3-1-3 K 均值算法的优缺点
  • 3-2 模拟退火算法
  • 3-2-1 模拟退火算法原理
  • 3-2-2 模拟退火算法步骤
  • 3-2-3 关键参数设置
  • 3-2-4 模拟退火算法流程
  • 3-3 基于模拟退火的K 均值聚类算法
  • 3-3-1 SAKM 算法的结合思想
  • 3-3-2 SAKM 算法具体步骤
  • 3-3-3 SAKM 算法流程
  • 3-3-4 SAKM 算法参数设置
  • 3-3-5 DK-t0 选取法
  • 3-3-6 SAKM 算法数据分析实验
  • 第四章 基于模拟退火的 K 调和均值聚类算法
  • 4-1 K 调和均值算法
  • 4-1-1 K 调和均值算法核心思想
  • 4-1-2 K 调和均值算法步骤
  • 4-1-3 K 调和均值算法流程
  • 4-2 基于模拟退火的K 调和均值聚类算法
  • 4-2-1 SAKHM 算法研究的难点
  • 4-2-2 SAKHM 算法参数设置
  • 4-2-3 KH&K 算法结合法
  • 4-2-4 SAKHM 算法具体步骤
  • 4-2-5 SAKHM 算法流程
  • 4-2-6 SAKHM 算法伪代码
  • 4-2-7 KM、SAKM、SAKHM 算法实验研究及结果对比
  • 第五章 基于模拟退火的 K 调和均值聚类算法的应用
  • 5-1 “校讯通”系统简介
  • 5-1-1 “校讯通”系统主要功能
  • 5-1-2 “校讯通”系统数据库结构
  • 5-2 聚类过程
  • 5-2-1 数据来源及属性
  • 5-2-2 数据预处理
  • 5-2-3 数据属性的选择
  • 5-2-4 数据标准化
  • 5-2-5 数据集聚类
  • 5-3 聚类结果及分析
  • 5-3-1 聚类结果
  • 5-3-2 结果分析
  • 5-3-3 “校讯通”系统数据库聚类分析结论
  • 第六章 总结和展望
  • 参考文献
  • 致谢
  • 攻读学位期间所取得的相关成果
  • 相关论文文献

    • [1].对k均值算法和硬C-均值算法的对比分析[J]. 洛阳理工学院学报(自然科学版) 2012(01)
    • [2].基于改进K均值算法的螺丝锁附结果分类研究[J]. 自动化与仪表 2020(04)
    • [3].基于K均值算法的数据聚类和图像分割研究[J]. 平顶山学院学报 2014(02)
    • [4].一种可选初始聚类中心的改进k均值算法[J]. 统计与决策 2014(12)
    • [5].改进k均值算法在网络入侵检测中的应用研究[J]. 计算机安全 2008(05)
    • [6].基于优化模糊C均值算法的锚泊船聚集特性[J]. 交通运输工程学报 2019(06)
    • [7].一种改进的K均值算法[J]. 科技资讯 2019(15)
    • [8].优化初值的C均值算法[J]. 吉林大学学报(工学版) 2018(01)
    • [9].基于K-均值算法的数据挖掘技术研究及应用[J]. 软件导刊 2017(04)
    • [10].基于K均值算法增强初始中心的研究[J]. 科技视界 2017(16)
    • [11].基于协同熵的K-均值算法[J]. 电光与控制 2015(07)
    • [12].一种高效的全局K-均值算法[J]. 长春理工大学学报(自然科学版) 2015(03)
    • [13].基于模糊C均值算法的云南草药聚类分析[J]. 计算机应用 2012(S2)
    • [14].基于改进的密度层次的K-均值算法研究[J]. 福建电脑 2018(01)
    • [15].基于改进模糊C均值算法的电力电子电路故障诊断[J]. 低压电器 2011(16)
    • [16].改进的k-均值算法在聚类分析中的应用[J]. 西安科技大学学报 2010(04)
    • [17].K均值算法实现遥感图像的非监督分类[J]. 机电工程 2008(03)
    • [18].K-均值算法聚类分析及其在人力资源管理中的应用[J]. 山东科学 2008(02)
    • [19].基于不确定数据的半监督动态K-均值算法在滑坡危险性预测上的应用[J]. 山东农业大学学报(自然科学版) 2020(02)
    • [20].一种递归K均值算法与上市公司绩效分类研究[J]. 中国商论 2018(30)
    • [21].动态阈值粗糙C均值算法[J]. 计算机科学 2011(03)
    • [22].基于密度的改进K均值算法及实现[J]. 计算机应用 2011(02)
    • [23].模糊C-均值算法在高考志愿填报中的应用[J]. 微计算机信息 2009(33)
    • [24].基于粒群优化的K均值算法及其应用[J]. 计算机工程 2008(16)
    • [25].一种基于模糊数学思想的K均值算法[J]. 软件导刊 2016(05)
    • [26].K均值算法影响因素的可视化分析[J]. 山西电子技术 2013(03)
    • [27].基于改进K-均值算法的未知雷达信号分选[J]. 现代电子技术 2010(17)
    • [28].k均值算法在网络入侵检测中的应用[J]. 微计算机信息 2009(15)
    • [29].基于孤立点和初始质心选择的k均值算法的改进与应用[J]. 陕西理工学院学报(自然科学版) 2009(03)
    • [30].应用于三维点云数据去噪的改进C均值算法[J]. 计算机工程与应用 2015(12)

    标签:;  ;  ;  ;  ;  

    改进K均值算法在数据挖掘中的研究应用
    下载Doc文档

    猜你喜欢