聚类结果评价方法与聚类知识提取技术的研究

聚类结果评价方法与聚类知识提取技术的研究

论文摘要

聚类是一种无监督的学习,其任务是按照给定的相似性将数据分组,使得同组数据彼此相似而不同组数据不相似。由于用来聚类的数据本身并没有类别信息,故而无法通过传统的“训练——测试”方法来判定聚类的效果。因此,对聚类结果的评判就只能依赖于聚类评价指标。聚类评价指标的作用是检测聚类的结果是否符合“同组数据相似,不同组数据不相似”的要求。而对于什么样的数据被称为相似则并无一个统一的标准。聚类算法与聚类评价指标所采取的相似性定义往往并不一致,这就导致了在某种意义下聚类评价指标的无用性。“可解释性”是评价聚类的一个重要依据,因此在评价聚类时应首先对聚类结果做出相应的解释,而后根据解释信息做出评价。解释聚类结果时首先应对聚类结果进行一定程度的抽象,提取出相应的知识;然后通过知识来描述、解释聚类结果。代表点方法是一类经典的聚类表示方法,基于这种方法构造的聚类算法与增量聚类算法都具有很好的效果。有鉴于此,本文提出了一种用聚类算法原有相似性定义进行聚类评价的方法。这种方法首先对聚类结果进行知识提取,抽取数据集中最为核心、最为本质的信息;然后针对这些本质信息做出相应评价,这种评价依据的是最小描述长度原理。实验表明,这种新的评价方法在一般情况下与大多数现有常用评价指标的结果一致;而在一些特殊应用场合则优于一些现有评价指标。除了可以给出具体的定量评价值之外,这种新的评价方法还可以对聚类结果的结构信息进行描述与分析。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 研究背景和意义
  • 1.2 聚类知识提取
  • 1.3 聚类评价
  • 1.4 本文章节安排
  • 1.5 本章小结
  • 第二章 聚类分析概述
  • 2.1 聚类分析背景
  • 2.1.1 主要聚类方法
  • 2.1.2 相似性度量
  • 2.2 聚类知识提取方法
  • 2.2.1 聚类知识表示
  • 2.2.2 知识提取方法
  • 2.2.3 聚类知识的用途
  • 2.3 聚类评价方法
  • 2.3.1 聚类评价方法概览
  • 2.3.2 聚类评价的作用
  • 2.4 本章小结
  • 第三章 基于代表点的聚类知识提取
  • 3.1 聚类描述方法概览
  • 3.1.1 k-平均算法
  • 3.1.2 CURE
  • 3.2 代表点描述方法
  • 3.3 相关说明
  • 3.4 基于代表点的聚类知识在增量聚类领域的应用
  • 3.4.1 增量挖掘技术的研究发展现状
  • 3.4.2 增量式的超球聚类算法
  • 3.5 本章小结
  • 第四章 基于知识的聚类评价
  • 4.1 聚类评价方法回顾
  • 4.2 基于知识的评价方式
  • 4.2.1 评价理论的原则
  • 4.2.2 基于代表点描述的聚类评价
  • 4.3 实验结果与分析
  • 4.4 本章小结
  • 第五章 总结与展望
  • 5.1 总结
  • 5.2 展望
  • 参考文献
  • 致谢
  • 在学期间的研究成果及发表的学术论文
  • 相关论文文献

    • [1].浅析大数据挖掘中抽样估计法的应用[J]. 现代信息科技 2019(21)
    • [2].基于大数据挖掘的广播电视客户价值分析[J]. 科技视界 2019(34)
    • [3].基于深度学习的工业领域数据挖掘方法及应用[J]. 数字技术与应用 2019(11)
    • [4].基于大数据思维的财务数据挖掘及应用研究[J]. 国际商务财会 2019(11)
    • [5].第16届高级数据挖掘和应用国际会议[J]. 软件工程 2020(04)
    • [6].基于云计算的大数据挖掘体系构建分析[J]. 中外企业家 2020(11)
    • [7].测绘地理信息专业背景下的《时空数据挖掘》课程设计[J]. 南宁师范大学学报(自然科学版) 2020(01)
    • [8].智慧医疗下云数据挖掘在精细化医疗管理中的应用[J]. 中医药管理杂志 2020(03)
    • [9].高校管理人员教育数据挖掘能力培养的实践价值与实施路径[J]. 中国教育信息化 2020(07)
    • [10].大数据环境下的数据挖掘课程教学探索[J]. 中国新通信 2020(06)
    • [11].第16届高级数据挖掘和应用国际会议[J]. 软件工程 2020(05)
    • [12].基于云计算的大数据挖掘内涵及解决方案研究[J]. 数字通信世界 2020(03)
    • [13].基于可拓数据挖掘的建筑立面设计方法研究[J]. 科技传播 2020(08)
    • [14].数据挖掘实践教学环节探索[J]. 科技经济导刊 2020(11)
    • [15].大数据挖掘与云服务模式的构建[J]. 江西电力职业技术学院学报 2020(01)
    • [16].医疗云存储下医院信息数据挖掘及实现技术的探索[J]. 信息与电脑(理论版) 2020(05)
    • [17].高校治理视阈下教育数据挖掘的应用与挑战[J]. 高教论坛 2020(04)
    • [18].大数据挖掘与分析的关键技术研究[J]. 中国新通信 2020(08)
    • [19].浅析数据挖掘[J]. 内江科技 2020(06)
    • [20].教育数据挖掘关键技术应用研究[J]. 轻纺工业与技术 2020(06)
    • [21].物联网海上舰船航行数据挖掘方法[J]. 舰船科学技术 2020(12)
    • [22].云环境中大数据挖掘的有效花费研究[J]. 上海理工大学学报 2020(03)
    • [23].对《零售数据挖掘与应用》课程教学的思考[J]. 知识经济 2020(18)
    • [24].教育数据挖掘和学习分析研究进展[J]. 牡丹江师范学院学报(自然科学版) 2020(03)
    • [25].第16届高级数据挖掘和应用国际会议[J]. 软件工程 2020(08)
    • [26].电商市场中大数据挖掘的分析以及决策探究[J]. 中国新通信 2020(12)
    • [27].关于大数据挖掘中的数据分类算法技术的研究[J]. 电脑知识与技术 2020(20)
    • [28].长输油气管道大数据挖掘与应用[J]. 物联网学报 2020(03)
    • [29].数据挖掘实践课程教学模式的探索[J]. 教育教学论坛 2020(36)
    • [30].第16届高级数据挖掘和应用国际会议[J]. 软件工程 2020(10)

    标签:;  ;  ;  ;  ;  ;  

    聚类结果评价方法与聚类知识提取技术的研究
    下载Doc文档

    猜你喜欢