定性数据的聚类方法及其应用探析

定性数据的聚类方法及其应用探析

论文摘要

“物以类聚,人以群分”,对事物进行分类,是人们认识事物的出发点,也是人们认识世界的一种重要方法,因此,分类学已成为人们认识世界的一门基础科学。随着多元统计分析的不断发展和完善,从数值分类学中逐渐分离出了聚类分析方法,其理论和应用都得到了迅速的发展。聚类分析是数据挖掘中重要而活跃的一个研究领域,无论是计算机领域,还是在统计分析领域,聚类分析都是数据预处理的有力工具,都形成了不同种类的聚类方法,如系统聚类法、K均值聚类法、PAM算法、BRICH算法等等。从目前的聚类方法看,大多数的方法都是基于数据间的距离和相似度来进行分析的,这要求所分析的数据必须是可以测度的,必须是定量的数据,但是随着计算机和电子信息技术的不断发展以及Internet和各种局域网的广泛普及,人们获得的数据正在以前所未有的速度急剧增加,这其中就包含了大量的定性数据,这使得传统的聚类方法无法有效地处理定性数据。基于此,本文分别从粗糙集分析、逻辑运算分析、秩分析和列联表分析等四个角度深入探讨并阐述了定性数据的聚类方法及其基本思想。文章的第一章首先简要阐述了聚类分析的基本概念和常用的聚类分析方法,并综述了国内外对定性数据聚类方法这一领域的研究成果,并概括地提出了本文的研究框架和研究内容。本文在第二章中首先从粗糙集的角度探讨了定性数据的聚类问题,利用粗糙集分析中属性重要性的概念,提出了基于属性重要性的定性数据聚类方法。在对逻辑运算这个概念进行剖析时,发现它与定性数据聚类问题有着很好的切入点,因此,本文在第三章中把逻辑运算引入定性数据的聚类分析中,提出了基于逻辑运算的定性数据聚类方法。接着,本文从将定性数据量化的角度进一步地分析定性数据的聚类问题。在第四章中把秩分析引入到问题的研究中,提出了基于秩分析的定性数据聚类方法。列联表是分析定性数据的有效工具,因此,在文章的第五章中,本文将列联表分析引入到问题的探讨中,提出了基于列联表分析的定性数据聚类方法。在每一章的最后部分,本文都利用获得的数据对每一个方法进行了实证分析,以更加清晰生动地阐述每一个方法的基本思想,并且得到了许多有用的结论。此外,在文章的第六章中,本文对所提出的四种方法一一进行总结和归纳,并从总体上对定性数据的聚类问题进行了总结与展望。本文的创新之处在于:(1)从粗糙集、逻辑运算这两个角度,利用定性数据本身直接进行分析,在不随意量化定性数据的前提下研究了定性数据的聚类问题,提出了两种定性数据聚类的方法;(2)从秩分析、列联表分析这两个角度对定性数据的聚类问题进行了分析,通过利用这两个工具对定性数据进行有效的量化,提出两种定性数据聚类的方法,并在实证过程中得到了定性数据聚类的谱系图。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 第一节 聚类分析理论综述
  • 第二节 研究目的与研究框架
  • 第二章 基于属性重要性的定性数据聚类分析方法及应用
  • 第一节 引言
  • 第二节 基于属性重要性的定性数据聚类方法
  • 第三节 方法应用
  • 第三章 基于逻辑运算的定性数据聚类分析方法及应用
  • 第一节 引言
  • 第二节 二进制码和逻辑运算
  • 第三节 基于异或逻辑运算的聚类方法
  • 第四节 方法应用
  • 第四章 基于秩分析的定性数据聚类分析方法及应用
  • 第一节 引言
  • 第二节 秩分析与基于秩分析的聚类方法
  • 第三节 方法应用
  • 第五章 基于列联表分析的定性数据聚类方法及其应用
  • 第一节 引言
  • 第二节 基于列联表分析的定性数据聚类方法的基本思想
  • 第三节 方法应用
  • 第六章 总结与展望
  • 参考文献
  • 致谢
  • 相关论文文献

    • [1].基于大数据聚类分析的电网信息化运维系统设计[J]. 电子技术与软件工程 2020(15)
    • [2].基于趋势函数的空间数据聚类方法[J]. 计算机工程与应用 2017(06)
    • [3].基于多源冲突数据聚类的态势估计方法[J]. 火力与指挥控制 2017(04)
    • [4].高流量负荷下基于支持向量机的空间数据聚类方法[J]. 微电子学与计算机 2017(08)
    • [5].基于大数据聚类的化妆品包装符号元素特征提取[J]. 日用化学工业 2020(01)
    • [6].基于流数据聚类算法的电力大数据异常检测[J]. 电力信息与通信技术 2020(03)
    • [7].基于信息粒数据重构的多关系数据聚类仿真[J]. 计算机仿真 2020(06)
    • [8].不确定数据聚类综述[J]. 电脑知识与技术 2017(01)
    • [9].基于优化粒子群算法的云环境大数据聚类算法[J]. 现代电子技术 2020(14)
    • [10].一种大规模流式数据聚类方法在交通热点分析中的应用[J]. 科学技术与工程 2017(15)
    • [11].一种基于抽样的大规模混合数据聚类集成算法[J]. 计算机科学 2016(09)
    • [12].基于指数衰减的演化数据聚类算法[J]. 计算机应用 2014(S2)
    • [13].基于约束满足的大数据聚类中心调度算法仿真[J]. 计算机仿真 2020(03)
    • [14].基于大数据聚类分析的电网信息化运维系统设计[J]. 电子设计工程 2020(14)
    • [15].基于抽样融合改进的大数据聚类方法[J]. 微电子学与计算机 2017(04)
    • [16].大规模数据聚类中模糊自适应谐振理论的研究与应用[J]. 计算机时代 2020(10)
    • [17].基于混沌关联维特征提取的大数据聚类算法[J]. 计算机科学 2016(06)
    • [18].用于单核苷酸多态性数据聚类分析的方法比较[J]. 中国医药导报 2015(25)
    • [19].基于最大频繁路径的元数据聚类方法[J]. 计算机工程 2010(21)
    • [20].不完整数据聚类算法研究[J]. 计算机技术与发展 2020(08)
    • [21].大数据聚类算法的研究现状与展望[J]. 无线互联科技 2018(18)
    • [22].函数型数据聚类分析研究综述与展望[J]. 数理统计与管理 2018(01)
    • [23].传统与流数据聚类算法[J]. 现代计算机 2020(29)
    • [24].基于近邻的不均衡数据聚类算法[J]. 工程科学学报 2020(09)
    • [25].基于作者科研关系的农业科学数据聚类方法研究与展望[J]. 农业展望 2017(12)
    • [26].基于改进免疫算法的数据聚类策略研究[J]. 计算机工程与设计 2012(10)
    • [27].一种新的类别型数据聚类算法[J]. 统计与决策 2016(23)
    • [28].非线性面板数据聚类方法研究[J]. 统计与信息论坛 2017(02)
    • [29].引入时频聚集交叉项干扰抑制的大数据聚类算法[J]. 计算机科学 2016(04)
    • [30].基于动态时间规整的面板数据聚类方法研究及应用[J]. 统计研究 2016(11)

    标签:;  ;  ;  

    定性数据的聚类方法及其应用探析
    下载Doc文档

    猜你喜欢