基于无监督决策树聚类方法的研究

基于无监督决策树聚类方法的研究

论文摘要

决策树是一种有监督的归纳学习算法,它用于对有类标的数据集进行分类,而聚类是一种无监督的学习算法,它可以对无类标的数据集进行分组,使组内的数据相似性最大,组间相似度最小。21世纪以来,越来越多的学者开始关注两种方法的融合。本文提出了一种新型的基于无监督决策树的聚类算法,可以对没有类标的数据进行学习,从而对数据集进行划分。新型的基于无监督决策树的聚类过程实际上是构建一棵无监督决策树的过程,测试属性的选择采用离散度和不一致性评估的方法;结点的分裂采用改进的山峰山谷分裂法;算法最后一步规定了树生长延伸的停止标准用以限制树的生长。最终建成树的叶子结点代表聚类结果的簇。实验验证了这种算法划分数据集的有效性,结果表明该学习算法无论是与有监督的学习算法C4.5相比还是与无监督学习算法k均值相比,其划分数据的正确率在一定程度上都有所提高。同时,从生成树的规模角度与C4.5算法作比较,结果表明该算法在一定程度上优于C4.5算法。此外,分析了这种算法的时间复杂度,与其它算法比较说明了此算法有较高的效率。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 研究背景与意义
  • 1.2 国内外研究现状
  • 1.3 研究内容
  • 1.4 论文组织
  • 第2章 预备知识
  • 2.1 决策树算法
  • 2.2 聚类算法
  • 2.3 数据预处理
  • 2.4 本章小结
  • 第3章 新型的基于无监督决策树聚类算法
  • 3.1 扩展属性选择
  • 3.1.1 离散度的定义以及数据不一致性的介绍
  • 3.1.2 用离散度或者不一致性作为启发式选择属性
  • 3.2 结点的分裂
  • 3.2.1 对于连续值属性的数据集进行结点分裂
  • 3.2.2 对于字符型属性的数据集进行结点分裂
  • 3.3 停止标准的判断
  • 3.4 举例
  • 3.5 算法时间复杂度的分析
  • 3.6 小结
  • 第4章 实验
  • 4.1 分割数据集正确性的测试
  • 4.2 分类规模的比较
  • 4.3 小结
  • 第5章 总结与展望
  • 5.1 本文总结
  • 5.2 工作展望
  • 参考文献
  • 致谢
  • 攻读学位期间取得的科研成果
  • 相关论文文献

    • [1].一种新的鲁棒无监督显著性目标检测方法[J]. 中国科技论文 2019(12)
    • [2].马来语领域多词组无监督识别[J]. 中国科学技术大学学报 2019(07)
    • [3].基于“声纹+”的无监督可信身份认证[J]. 信息安全研究 2020(07)
    • [4].基于生成对抗网络的无监督域适应分类模型[J]. 电子学报 2020(06)
    • [5].你是一个自律的人吗[J]. 成才与就业 2020(06)
    • [6].基于表示学习的无监督跨语言专利推荐研究[J]. 数据分析与知识发现 2020(10)
    • [7].利用稳健非负矩阵分解实现无监督高光谱解混[J]. 中国图象图形学报 2020(04)
    • [8].基于无监督特征学习的手势识别方法[J]. 微电子学与计算机 2016(01)
    • [9].基于互信息的无监督特征选择[J]. 计算机研究与发展 2012(02)
    • [10].一种基于聚类的无监督异常检测方法[J]. 计算机工程与应用 2008(01)
    • [11].结合注意力与无监督深度学习的单目深度估计[J]. 广东工业大学学报 2020(04)
    • [12].无监督特征学习的人体活动识别[J]. 国防科技大学学报 2015(05)
    • [13].基于免疫网络的无监督式分类算法[J]. 山东大学学报(工学版) 2010(05)
    • [14].无监督排序学习算法的一致性比较[J]. 河北大学学报(自然科学版) 2015(02)
    • [15].一种无需初始化的遥感图像无监督分割方法[J]. 小型微型计算机系统 2010(10)
    • [16].无监督词义消歧研究[J]. 软件学报 2009(08)
    • [17].一种基于密度的无监督联系发现方法[J]. 中国管理科学 2008(S1)
    • [18].基于无监督算法的电能替代潜能用户识别系统设计[J]. 电子设计工程 2020(11)
    • [19].基于判别性样本选择的无监督领域自适应方法[J]. 西北工业大学学报 2020(04)
    • [20].基于无监督特征对齐的变负载下滚动轴承故障诊断方法[J]. 中国电机工程学报 2020(01)
    • [21].无监督机器学习在游戏反欺诈领域的应用研究[J]. 信息网络安全 2020(09)
    • [22].改进的无监督同时正交基聚类特征选择[J]. 吉林化工学院学报 2019(07)
    • [23].无监督条件下跨领域目标识别关键技术研究[J]. 自动化技术与应用 2019(11)
    • [24].基于视觉概率统计的无监督数字抠图模型[J]. 计算机工程与应用 2015(18)
    • [25].增强的无监督人脸鉴别技术[J]. 计算机工程与应用 2010(18)
    • [26].基于稀疏回归和谱分析的无监督特征选择算法[J]. 计算机与数字工程 2020(02)
    • [27].最大熵和?_(2,0)范数约束的无监督特征选择算法[J]. 计算机工程与应用 2020(11)
    • [28].基于自注意力机制的多阶段无监督单目深度估计网络[J]. 信号处理 2020(09)
    • [29].一种基于规则的无监督词性标注方法[J]. 吉林大学学报(理学版) 2015(05)
    • [30].看法五:校长组阁制:掌控公权力的少数人对教育的亵渎[J]. 江苏教育 2010(11)

    标签:;  ;  ;  ;  

    基于无监督决策树聚类方法的研究
    下载Doc文档

    猜你喜欢