论文摘要
在模式识别系统中,分类器是一个重要的组成部分,分类器设计的好坏将直接影响模式识别系统最终的识别性能。线性分类器因其简单、易于分析和实现且容易推广为非线性分类器的优点而成为模式分类最常用的分类器,并产生了感知器(Perceptron)、松弛算法(Relaxation)、最小平方误差(Minimum Square Error,MSE)和Ho-Kashyap(H-K)算法等经典算法。正则化的Ho-Kashyap线性分类算法(MHKS)采用了支持向量机最大化间隔的思想,在实验中获得了较传统H-K算法更优的推广性能和分类性能。然而现有的线性分类器几乎都是针对向量模式的,即所有的模式都采用向量表示,要应用于矩阵表示的模式,必须首先将矩阵模式转换成向量模式。如此转换至少会带来三个不足:1)空间或结构信息可能会遭到破坏;2)由于权向量的维数等于输入模式的维数,当输入模式维数很大时,权值的存储空间相应的会很大;3)对于大维数的向量模式,当样本数不多的时候,利用线性分类器易导致过拟合。受到已有面向矩阵的特征提取方法的启发,本文将此方法引入到正则化H-K线性分类器的设计中,设计出面向矩阵模式的双边正则化H-K分类算法MatMHKS,克服了以上不足,并继承了MHKS算法的优点。与MHKS相比,在公共数据集上实验都取得了更好的分类性能。本文的另外一个工作是将所设计的分类算法应用于乳腺癌计算机辅助诊断中,并根据医学诊断中漏诊和误诊代价不同的特点,在MatMHKS中引入代价因子,设计出代价敏感的MatMHKS算法(CS-MatMHKS)。在乳腺癌早期诊断中,乳腺X片被认为是最有效的技术之一,乳腺癌在X线图像下的主要表现是肿块和微钙化点,本文主要是针对微钙化簇,首先提取一系列医学专家认为对分类有用的特征,然后直接用CS-MatMHKS分类器进行诊断,从而保留了较多的判别信息,同时当提取的特征很多即输入模式维数很大时,用矩阵化算法又降低了发生过拟合(overfitting)的可能性。在公共乳腺癌数据库DDSM上进行了实验,并且与支持向量机(SVM)以及BP神经网络分类算法进行比较,获得了更优的分类性能。
论文目录
相关论文文献
标签:模式识别论文; 线性分类器论文; 矩阵模式论文; 修改的准则论文; 乳腺癌诊断论文; 乳腺片论文; 微钙化点论文; 特征提取论文;