论文摘要
肺癌是全球头号癌症杀手,治愈肺癌一直是人类追求的目标。肺癌治愈的关键是早期诊断。胸部X射线作为临床常规检查之一,在临床实践中普遍应用,它使得原发性肺癌早期诊断变得有意义。但同时也带来了问题:放射科医师面对大量的图像,漏诊和误诊随之产生。利用图像处理和模式识别技术使得计算机辅助读片可能,它将有助于提高放射科医生的工作效率,降低他们的阅片疲劳,从而提高肺癌的诊断精度。肺部结节的检测分为图像的预处理、肺部的提取、感兴趣区域(ROI)的分割、ROI特征提取和分类。采用传统的分类算法分类时,由于临床数据中正常样本远远多于肿瘤样本,整体分类性能很差。因此,研究不平衡数据集的分类问题显得格外重要。本文从三个方面来研究本课题:首先,本文提出了一种新型的过采样算法——基于LLE的SMOTE算法。将非线性降维方法和过采样算法相结合来降低数据的不平衡性,我们利用局部线性映射算法(LLE)将原有的数据集降维,然后通过合成少数类过抽样算法(SMOTE)在降维后更加线性可分的数据上过采样,最后再将这部分新合成的低维空间上的样本点映射回原来数据集的空间。其次,我们研究了不同惩罚系数的支持向量机算法(SDC),通过对两个类别施加不同惩罚系数,并用序列最小优化算法简单快速的解决了SDC中的优化问题。最后,对遗传算法如何运用到特征选择做了详细的介绍。实验证明,使用上述三种算法对不平衡数据进行分类,每种方法都有效的提高了系统的分类效果。
论文目录
摘要ABSTRACT1 绪论1.1 肺癌的发病现状以及主要危险因素1.2 肺癌的诊断方法1.3 国内外研究现状1.3.1 计算机辅助诊断的基本概念1.3.2 国内外发展现状1.4 本课题的意义及主要内容1.5 论文的结构2 基于LLE 的SMOTE 算法的研究2.1 LLE 算法原理及实现2.1.1 LLE 算法概要介绍2.1.2 LLE 算法实现2.2 基于LLE 的SMOTE 算法2.2.1 SMOTE 算法介绍2.2.2 基于LLE 的SMOTE 算法2.3 实验结果与分析2.3.1 实验数据来源及说明2.3.2 实验方法2.3.3 ROC 分析的基本原理2.3.4 实验结果及参数设置2.4 本章小结3 基于SMO 的不同惩罚系数的SVM 算法的研究3.1 SVM 的原理3.1.1 线型可分的类3.1.2 线型不可分的类3.1.3 非线型SVM3.2 不同惩罚系数的SVM3.3 基于序列最小优化算法的求解3.3.1 序列最小优化算法3.3.2 基于序列最小优化的SDC 的求解3.4 实验结果与分析3.5 本章小结4 利用遗传算法进行特征选择4.1 遗传算法的原理4.1.1 遗传算法的概要介绍4.1.2 遗传算法的基本步骤4.2 特征选择4.2.1 特征选择的概念4.2.2 特征选择的方法4.3 基于遗传算法的特征选择4.3.1 遗传个体表示4.3.2 初始种群的生成4.3.3 适应度函数定义4.3.4 选择配对体4.3.5 交叉4.3.6 变异4.3.7 新一代群体生成4.3.8 终止条件的定义4.4 实验结果和讨论4.5 本章小结5 结论与展望5.1 结论5.2 展望参考文献致谢攻读学位期间发表的学术论文
相关论文文献
标签:不平衡数据论文; 计算机辅助诊断论文; 分类论文; 局部线性映射算法论文; 少数类过抽样算法论文;
胸部X线影像中肺部结节的自动检测技术 ——不平衡数据集的分类
下载Doc文档