胸部X线影像中肺部结节的自动检测技术 ——不平衡数据集的分类

胸部X线影像中肺部结节的自动检测技术 ——不平衡数据集的分类

论文摘要

肺癌是全球头号癌症杀手,治愈肺癌一直是人类追求的目标。肺癌治愈的关键是早期诊断。胸部X射线作为临床常规检查之一,在临床实践中普遍应用,它使得原发性肺癌早期诊断变得有意义。但同时也带来了问题:放射科医师面对大量的图像,漏诊和误诊随之产生。利用图像处理和模式识别技术使得计算机辅助读片可能,它将有助于提高放射科医生的工作效率,降低他们的阅片疲劳,从而提高肺癌的诊断精度。肺部结节的检测分为图像的预处理、肺部的提取、感兴趣区域(ROI)的分割、ROI特征提取和分类。采用传统的分类算法分类时,由于临床数据中正常样本远远多于肿瘤样本,整体分类性能很差。因此,研究不平衡数据集的分类问题显得格外重要。本文从三个方面来研究本课题:首先,本文提出了一种新型的过采样算法——基于LLE的SMOTE算法。将非线性降维方法和过采样算法相结合来降低数据的不平衡性,我们利用局部线性映射算法(LLE)将原有的数据集降维,然后通过合成少数类过抽样算法(SMOTE)在降维后更加线性可分的数据上过采样,最后再将这部分新合成的低维空间上的样本点映射回原来数据集的空间。其次,我们研究了不同惩罚系数的支持向量机算法(SDC),通过对两个类别施加不同惩罚系数,并用序列最小优化算法简单快速的解决了SDC中的优化问题。最后,对遗传算法如何运用到特征选择做了详细的介绍。实验证明,使用上述三种算法对不平衡数据进行分类,每种方法都有效的提高了系统的分类效果。

论文目录

  • 摘要
  • ABSTRACT
  • 1 绪论
  • 1.1 肺癌的发病现状以及主要危险因素
  • 1.2 肺癌的诊断方法
  • 1.3 国内外研究现状
  • 1.3.1 计算机辅助诊断的基本概念
  • 1.3.2 国内外发展现状
  • 1.4 本课题的意义及主要内容
  • 1.5 论文的结构
  • 2 基于LLE 的SMOTE 算法的研究
  • 2.1 LLE 算法原理及实现
  • 2.1.1 LLE 算法概要介绍
  • 2.1.2 LLE 算法实现
  • 2.2 基于LLE 的SMOTE 算法
  • 2.2.1 SMOTE 算法介绍
  • 2.2.2 基于LLE 的SMOTE 算法
  • 2.3 实验结果与分析
  • 2.3.1 实验数据来源及说明
  • 2.3.2 实验方法
  • 2.3.3 ROC 分析的基本原理
  • 2.3.4 实验结果及参数设置
  • 2.4 本章小结
  • 3 基于SMO 的不同惩罚系数的SVM 算法的研究
  • 3.1 SVM 的原理
  • 3.1.1 线型可分的类
  • 3.1.2 线型不可分的类
  • 3.1.3 非线型SVM
  • 3.2 不同惩罚系数的SVM
  • 3.3 基于序列最小优化算法的求解
  • 3.3.1 序列最小优化算法
  • 3.3.2 基于序列最小优化的SDC 的求解
  • 3.4 实验结果与分析
  • 3.5 本章小结
  • 4 利用遗传算法进行特征选择
  • 4.1 遗传算法的原理
  • 4.1.1 遗传算法的概要介绍
  • 4.1.2 遗传算法的基本步骤
  • 4.2 特征选择
  • 4.2.1 特征选择的概念
  • 4.2.2 特征选择的方法
  • 4.3 基于遗传算法的特征选择
  • 4.3.1 遗传个体表示
  • 4.3.2 初始种群的生成
  • 4.3.3 适应度函数定义
  • 4.3.4 选择配对体
  • 4.3.5 交叉
  • 4.3.6 变异
  • 4.3.7 新一代群体生成
  • 4.3.8 终止条件的定义
  • 4.4 实验结果和讨论
  • 4.5 本章小结
  • 5 结论与展望
  • 5.1 结论
  • 5.2 展望
  • 参考文献
  • 致谢
  • 攻读学位期间发表的学术论文
  • 相关论文文献

    标签:;  ;  ;  ;  ;  

    胸部X线影像中肺部结节的自动检测技术 ——不平衡数据集的分类
    下载Doc文档

    猜你喜欢