高维数据挖掘在天体粗分类中的应用

高维数据挖掘在天体粗分类中的应用

论文摘要

天体光谱蕴含着天体重要的物理信息,通过光谱的研究,人们可以定性或定量地测定天体的化学成分,直接或者间接地确定天体的表面温度,光度,直径,质量,研究天体的视向运动和自转。因此,光谱分析在天体和物理学中占有重要地位。LAMOST望远镜建成以后,每个观测夜都将产生上万条光谱。如何处理这些海量光谱从而及时获得所需的科学信息成为一项重要的议题。数据挖掘技术正在众多领域中得到广泛的应用,它是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。运用数据挖掘技术可以实现相关性预测,分类,聚类,孤立点发现,时间序列分析等等功能,许多针对高维数据的挖掘算法也正成为研究的热点,光谱数据本身就是高维的,因此,面对海量的光谱数据,数据挖掘技术正好可以为解决光谱数据的分类,参数测量等工作提供很好的支持。按照LAMOST的科学目标,光谱数据的分类可以分为粗分类和细分类两大部分。其中粗分类是指首先将天体光谱分成正常天体和发射线天体,然后将正常天体分成正常星系和恒星,发射线天体分成星暴星系和活动星系核。本论文的主要工作针对天体粗分类展开,主要工作包括:1)研究了覆盖算法,总结该算法的特点并提出相应的改进。覆盖算法主要由下述两步构成:首先将分类问题转换成一个集覆盖问题,然后通过求解最小支撑覆盖集来完成分类。其中,论文中讨论的是基于类间最大距离算法。该算法是一种构造性算法,不涉及任何迭代计算,算法时间性能只取决于覆盖点的个数。论文指出根据覆盖算法的原理,随着覆盖半径的增大,将增加支撑覆盖集的支撑覆盖点个数;而当覆盖半径逐渐减小时,支撑覆盖集的支撑覆盖点个数将递增。覆盖半径的选择应根据实际情况灵活设置,多次试验取得最优值,从而使算法在精确度和速度上都取得较好实际效果。其次提出计算样本点之间的距离时应该采用对各特征向量加权的方法计算,这样进一步提高分类的准确性。2)按照数据挖掘的一般流程,对晚型星和类星体两类星体的分类构建了挖掘模型,采用图示的方式,抓取两类不同星体的特征,用规则对两类星体较好的进行了分类。分类算法简洁迅速。在系统实现过程中,开发平台采用了微软新推的.NET架构,开发语言是面向.NET的开发语言C#。系统主要包含预处理、谱线图示,分类训练几个模块。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 引言
  • 1.2 LAMOST项目
  • 1.2.1 LAMOST简介
  • 1.2.2 LAMOST的科学意义和科学目标
  • 1.2.3 LAMOST光谱自动处理综述
  • 1.3 天体粗分类
  • 1.3.1 天体辐射与天体分类
  • 1.3.2 天体光谱分类
  • 1.4 研究现状和本文组织结构
  • 第二章 高维数据挖掘技术
  • 2.1 引言
  • 2.2 数据挖掘技术
  • 2.2.1 概念
  • 2.2.2 数据挖掘的步骤
  • 2.2.3 数据挖掘的种类方法
  • 2.3 分类与分类器构造方法
  • 2.3.1 分类器
  • 2.3.2 构造方法
  • 2.3.2.1 主成分分析方法
  • 2.3.2.2 CLIQUE算法
  • 2.3.2.3 神经网络技术
  • 2.3.2.4 支撑向量机
  • 2.4 本章总结
  • 第三章 分类判别的覆盖算法及其改进
  • 3.1 引言
  • 3.2 基本知识
  • 3.3 覆盖算法
  • 3.2.1 基本原理
  • 3.2.2 基于类间最大距离算法
  • 3.2.3 算法优缺点分析及其改进
  • 3.4 本章总结
  • 第四章 一个类星体和晚型星分类的实例
  • 4.1 引言
  • 4.2 概念与实验数据
  • 4.3 系统设计
  • 4.3.1 分类挖掘流程
  • 4.3.2 功能模块
  • 4.3.3 用户界面设计
  • 4.4 技术选择
  • 4.4.1 .NET架构
  • 4.4.2 C#语言
  • 4.5 类星体与晚型星分类算法
  • 4.5.1 光谱可视化
  • 4.5.2 分类规则
  • 4.5.3 实验结果及其分析
  • 4.6 本章小结
  • 第五章 总结
  • 参考文献
  • 致谢
  • 攻读学位期间发表的学术论文目录
  • 学位论文评阅及答辩情况表
  • 相关论文文献

    • [1].基于分形编码的天体光谱降噪方法[J]. 光谱学与光谱分析 2011(12)
    • [2].基于概念格的天体光谱离群数据识别方法[J]. 自动化学报 2008(09)
    • [3].基于深度信念网络的天体光谱自动分类研究[J]. 云南民族大学学报(自然科学版) 2017(02)
    • [4].基于约束概念格的天体光谱局部离群数据挖掘系统[J]. 光谱学与光谱分析 2009(02)
    • [5].基于改进密度聚类算法的天体光谱自动分类处理[J]. 电子技术与软件工程 2017(17)
    • [6].基于小波包与支撑矢量机的天体光谱自动分类方法[J]. 北京交通大学学报 2008(02)
    • [7].基于DenseNet的天体光谱分类方法[J]. 天文研究与技术 2020(01)
    • [8].基于核岭回归方法的恒星大气物理参数的自动测量[J]. 光谱学与光谱分析 2020(04)
    • [9].LAMOST天体光谱巡天[J]. 物理 2015(04)
    • [10].一种基于属性权值和w_k-距离的天体光谱异常特征线挖掘方法[J]. 光谱学与光谱分析 2013(08)
    • [11].基于Fisher判别的半监督天体光谱数据特征降维[J]. 太原科技大学学报 2012(05)
    • [12].一种基于约束FP树的天体光谱数据相关性分析方法[J]. 模式识别与人工智能 2009(04)
    • [13].基于约束FP树的天体光谱数据相关性分析系统研究[J]. 光谱学与光谱分析 2008(12)
    • [14].一种高效的稀有天体光谱检索方法[J]. 软件 2017(10)
    • [15].电偶极子模型在天体光谱中的应用[J]. 大学物理 2019(02)
    • [16].基于WebSocket消息机制的光谱协同分析系统[J]. 计算机系统应用 2013(06)
    • [17].云南暗弱天体光谱及成像仪长缝光谱研究[J]. 天文研究与技术 2012(04)
    • [18].一种基于PCA和系统成团法的聚类软件设计[J]. 计算机科学 2008(04)
    • [19].银汉迢迢,等待更多“摘星手”[J]. 红外 2016(01)
    • [20].大规模天文光谱巡天[J]. 中国科学:物理学 力学 天文学 2014(10)
    • [21].LAMOST“小系统”成功产出光谱[J]. 天文爱好者 2008(04)
    • [22].2.4米望远镜干涉条纹的去除及对测光的影响[J]. 天文研究与技术 2013(04)
    • [23].基于PSO的二阶段光谱模糊聚类研究[J]. 光谱学与光谱分析 2009(04)
    • [24].基于局部均值的K-近质心近邻光谱分类[J]. 光谱学与光谱分析 2015(04)
    • [25].LAMOST-DR1中激变变星光谱的数据挖掘研究[J]. 光谱学与光谱分析 2016(07)
    • [26].一种基于剪枝的横向分块概念格构造算法[J]. 小型微型计算机系统 2011(07)
    • [27].崔向群:打造世界第一望远镜[J]. 瞭望 2010(10)
    • [28].基于微粒群和子空间的离群数据挖掘算法研究[J]. 系统仿真学报 2009(07)

    标签:;  ;  ;  ;  

    高维数据挖掘在天体粗分类中的应用
    下载Doc文档

    猜你喜欢