新颖的模式分类算法MatMHKS及在乳腺癌计算机辅助诊断中的应用

新颖的模式分类算法MatMHKS及在乳腺癌计算机辅助诊断中的应用

论文摘要

在模式识别系统中,分类器是一个重要的组成部分,分类器设计的好坏将直接影响模式识别系统最终的识别性能。线性分类器因其简单、易于分析和实现且容易推广为非线性分类器的优点而成为模式分类最常用的分类器,并产生了感知器(Perceptron)、松弛算法(Relaxation)、最小平方误差(Minimum Square Error,MSE)和Ho-Kashyap(H-K)算法等经典算法。正则化的Ho-Kashyap线性分类算法(MHKS)采用了支持向量机最大化间隔的思想,在实验中获得了较传统H-K算法更优的推广性能和分类性能。然而现有的线性分类器几乎都是针对向量模式的,即所有的模式都采用向量表示,要应用于矩阵表示的模式,必须首先将矩阵模式转换成向量模式。如此转换至少会带来三个不足:1)空间或结构信息可能会遭到破坏;2)由于权向量的维数等于输入模式的维数,当输入模式维数很大时,权值的存储空间相应的会很大;3)对于大维数的向量模式,当样本数不多的时候,利用线性分类器易导致过拟合。受到已有面向矩阵的特征提取方法的启发,本文将此方法引入到正则化H-K线性分类器的设计中,设计出面向矩阵模式的双边正则化H-K分类算法MatMHKS,克服了以上不足,并继承了MHKS算法的优点。与MHKS相比,在公共数据集上实验都取得了更好的分类性能。本文的另外一个工作是将所设计的分类算法应用于乳腺癌计算机辅助诊断中,并根据医学诊断中漏诊和误诊代价不同的特点,在MatMHKS中引入代价因子,设计出代价敏感的MatMHKS算法(CS-MatMHKS)。在乳腺癌早期诊断中,乳腺X片被认为是最有效的技术之一,乳腺癌在X线图像下的主要表现是肿块和微钙化点,本文主要是针对微钙化簇,首先提取一系列医学专家认为对分类有用的特征,然后直接用CS-MatMHKS分类器进行诊断,从而保留了较多的判别信息,同时当提取的特征很多即输入模式维数很大时,用矩阵化算法又降低了发生过拟合(overfitting)的可能性。在公共乳腺癌数据库DDSM上进行了实验,并且与支持向量机(SVM)以及BP神经网络分类算法进行比较,获得了更优的分类性能。

论文目录

  • 第一章 绪论
  • 1.1 模式识别及模式分类
  • 1.2 模式识别在乳腺癌诊断中的应用
  • 1.3 本文主要的工作
  • 1.4 本文各章内容安排
  • 第二章 线性分类器
  • 2.1 线性判别函数
  • 2.2 Ho-Kashyap 算法
  • 2.3 正则化的 Ho-Kashyap 算法(MHKS)
  • 第三章 面向矩阵模式的正则化 H-K 算法
  • 3.1 算法的提出
  • 3.2 面向矩阵模式的正则化 H-K 算法
  • 3.3 MatMHKS 与 MHKS 算法之间的关系
  • 第四章 实验以及相关讨论
  • 4.1 实验相关数据集
  • 4.2 实验的初始化以及参数的选择
  • 4.3 实验结果
  • 4.4 图像数据库上的进一步实验
  • 4.5 进一步的探讨
  • 4.6 MatMHKS 与 MatPCA、MatFLDA 之间的比较
  • 4.7 本章总结
  • 第五章 MatMHKS 算法在乳腺癌诊断上的应用
  • 5.1 乳腺癌计算机辅助诊断系统概述
  • 5.2 图像预处理
  • 5.3 特征提取
  • 5.4 代价敏感的面向矩阵模式的正则化 Ho-Kashyap 算法
  • 5.5 实验结果及讨论
  • 5.6 本章总结
  • 第六章 总结及后继工作
  • 6.1 总结
  • 6.2 后继工作
  • 参考文献
  • 致谢
  • 硕士研究生期间参与的科研项目及发表的论文
  • 相关论文文献

    标签:;  ;  ;  ;  ;  ;  ;  ;  

    新颖的模式分类算法MatMHKS及在乳腺癌计算机辅助诊断中的应用
    下载Doc文档

    猜你喜欢