关于马田系统若干问题的研究 ——以医疗数据为例

关于马田系统若干问题的研究 ——以医疗数据为例

论文摘要

马田系统(Mahalanobis-Taguchi System,MTS)是由日本著名质量工程学家田口玄一博士首先提出的一种新的模式识别方法,它以基于马氏距离(MahalanobisDistance,MD)的信噪比(Signal to Noise Ratio,RSN)为优化指标,应用二水平正交表进行有效特征的选择,通过样品的马氏距离达到数据分类与判别分析的目的。目前,国际上马田系统的应用领域已经非常广泛,创造了巨大的经济效益和社会效益。但是,在我国,关于马田系统的理论与应用研究才刚刚起步,研究基础还相当薄弱。本论文的研究思路为:首先,系统回顾马田系统理论和应用的国内外最新进展和研究;其次,在对马田系统进行深入分析的基础之上,通过对距离统计量与相似系数统计量的整合,构造一个新的类别可分性指标,使之既能反映样品之间的距离贴近程度,同时又能反映样品之间的形状相似程度;第三,通过计算每个特征变量的熵值,Ⅰ类分析特征变量的有效性,并通过模糊聚类的分析方法,对特征变量进行模糊聚类分析,使得相似的特征变量归为一类,从而达到识别Ⅱ类特征变量的目的;第四,根据分类类型的不同(有序分割类型与一般分割类型),分别通过3σ准则与扰动模糊分析方法,将两类判别的状况发展至多类判别,给出一般意义上的多类判别准则;最后,运用马田系统进行疾病诊断的研究,运用理论指导实践,并为我国的疾病诊断提供新的技术和方法。本论文主要研究内容及结论有:1)距离统计量的比较研究经典马田系统中,类别可分性指标采用的是马氏距离统计量。从理论上讲,相比较其他距离测度,马氏距离有着比较科学的内涵:考虑到相关性、量纲的影响以及线性变换不变性等。试验也表明,马氏距离具有更好的判别效果。2)类别可分性指标的拓展研究在经典的马田系统中,所用类别可分性指标为距离统计量。应用距离统计量作为类别可分性指标,虽然能够有效地识别出样本之间的距离贴近程度,但却不能准确地衡量样本之间的形状相似程度。在某些识别场合下,样本之间的形状相似较之距离贴近显得更为重要。因此,本论文对经典马田系统的类别可分性指标进行拓展,整合了距离统计量与相似系数统计量,构建了样本近似度统计量,使之既能够体现样本之间的距离贴近程度,也能够衡量样本之间的形状相似程度。3)特征变量选择方法的研究经典马田系统采用正交表与信噪比的方法来判定特征变量有效性。这种方法不仅计算繁杂,而且随着特征变量的增多,计算量也随之成倍增大。本论文根据田口玄一的基于数据分析的思想,讨论了熵值法在特征变量优化选择问题中的应用,阐明了应用熵值法进行特征变量选择的基本原理与计算过程,并通过实际的应用算例表明熵值法的有效性。利用二水平正交表法与熵值原理法能够剔出掉那些对识别效果起负作用或者基本不起作用的特征变量(Ⅰ类特征变量),但是却难以识别出那些对最终识别效果起相似作用的特征变量(Ⅱ类特征变量)。笔者通过模糊聚类的分析方法,对特征变量进行模糊聚类分析,使得相似的特征变量归为一类,从而达到识别Ⅱ类特征变量的目的。4)马田系统多类判别研究经典马田系统中,由于基准空间是由一类正常总体所定义,因而对于判别待检样品正常与否的两类判别情形具有良好的效果。然而,对于多类判别的情形,经典的马田系统方法则不能很好的解决此类问题。本论文依据分类两种类型(有序分割类型与一般类型),分别采用3σ准则与扰动模糊的分析方法,对多类判别进行了研究,并阐明了进行多类判别的原理与计算过程。5)马田系统在医疗诊断中的应用研究马田系统是基于数据分析的方法而不是基于变量概率分布的方法,它具有良好的应用价值。本论文选取一类典型的、在临床诊断中具有一定难度的疾病——肺病疾病,通过一定数量的健康数据作为训练样品,构造该疾病的基准空间,并通过特征优化方法对基准空间进行优化;通过构造特征变量与疾病类型之间的扰动模糊关系,将待检样品与模糊扰动模糊关系作用,确定样品的疾病类型,达到疾病诊断的目的。

论文目录

  • 摘要
  • Abstract
  • 1 绪论
  • 1.1 模式识别与马田系统
  • 1.2 马田系统的研究意义
  • 1.3 马田系统的国内外研究现状
  • 1.4 本论文研究的主要内容及章节结构
  • 2 经典马田系统概述
  • 2.1 经典模型
  • 2.2 MTGS法
  • 2.3 数学模型
  • 2.4 稳健马田系统模型
  • 2.5 扩展应用方法
  • 2.5.1 伴随矩阵法
  • 2.5.2 β调整法
  • 2.5.3 多重马氏距离法
  • 2.6 马田系统的应用
  • 2.7 本章小结
  • 3 关于类别可分性指标的研究
  • 3.1 距离统计量
  • 3.2 马田系统中的马氏距离选择
  • 3.2.1 马田系统中的马氏距离
  • 3.2.2 马氏距离与欧式距离
  • 3.2.3 应用示例
  • 3.3 类别可分性指标的拓展
  • 3.3.1 当前问题
  • 3.3.2 形状相似统计量
  • 3.3.3 样本近似度
  • 3.3.4 特征变量类型确定的正交表法
  • 3.3.5 应用示例
  • 3.4 本章小结
  • 4 关于特征变量选择方法的研究
  • 4.1 特征变量选择的试验方法
  • 4.2 方差分析在MTS特征变量选择中的应用
  • 4.2.1 数据采集
  • 4.2.2 方差分析的计算步骤
  • 4.2.3 应用示例
  • 4.3 基于熵理论的特征变量选择
  • 4.3.1 熵与熵值函数
  • 4.3.2 特征变量选择的熵值法基本原理
  • 4.3.3 应用示例
  • 4.4 基于聚类统计分析的特征变量选择
  • 4.4.1 模糊聚类分析原理
  • 4.4.2 特征变量选择的模糊聚类分析方法
  • 4.4.3 应用示例
  • 4.5 本章小结
  • 5 关于多类判别的研究
  • 5.1 多元空间多类模式识别方法概述
  • 5.2 马田系统类别判别的过程
  • 5.2.1 基准空间的确定
  • 5.2.2 基准空间的有效性确认
  • 5.2.3 基准空间的优化
  • 5.2.4 待检样品与基准空间关系的确定
  • 5.2.5 待检样品类别属性的识别
  • 5.3 有序分割类型
  • 5.3.1 基本概念
  • 5.3.2 多类判别的实施
  • 5.3.3 关于类别临界域的讨论
  • 5.4 一般分割类型
  • 5.4.1 常规方法
  • 5.4.2 扰动模糊数学方法
  • 5.5 本章小结
  • 6 基于马田系统的多类判别应用案例
  • 6.1 基准空间的构建及其优化
  • VW确定'>6.2 扰动模糊关系RVW确定
  • 6.3 多类判别过程
  • 6.4 本章小节
  • 7 结论与展望
  • 7.1 主要工作与结论
  • 7.2 主要创新点
  • 7.3 今后的研究方向
  • 致谢
  • 参考文献
  • 博士学位在读期间发表的论文及科研情况
  • 相关论文文献

    • [1].个体特征变量视角下企业知识员工组织承诺差异的比较研究[J]. 广州大学学报(社会科学版) 2015(05)
    • [2].贪心算法的地理加权回归特征变量选择方法[J]. 测绘科学 2016(07)
    • [3].我国中等收入群体的微观影响因素分析——基于个体特征变量的实证研究[J]. 统计与咨询 2020(03)
    • [4].基于数据分析的配电网故障数据特征变量提取[J]. 电力大数据 2018(03)
    • [5].个性特征变量对隐私关注影响的实证研究[J]. 现代教育技术 2008(05)
    • [6].基于企业特征变量的质量管理实践与绩效关系的实证研究[J]. 浙江大学学报(人文社会科学版) 2012(01)
    • [7].特征变量的灰色模糊动态聚类选择方法[J]. 雷达科学与技术 2016(03)
    • [8].高校大学生非正式组织识别的实证研究——基于4省21所高校的调查分析[J]. 现代教育管理 2013(11)
    • [9].基于MTS的设备状态特征识别与优选[J]. 机械科学与技术 2012(05)
    • [10].特征变量选择和回归方法相结合的土壤有机质含量估算[J]. 光学学报 2019(09)
    • [11].基于filter-wrapper的两步特征变量提取方法[J]. 机电工程 2010(04)
    • [12].个人—组织契合度在人口特征变量上的差异及应用研究[J]. 河海大学学报(哲学社会科学版) 2009(01)
    • [13].英语学习目标水平及受外部特征变量影响分析——以南京体育学院为例[J]. 湖北广播电视大学学报 2018(02)
    • [14].银行特征变量对商业银行风险承担的影响——基于利率市场化视角[J]. 税务与经济 2015(05)
    • [15].水稻冠层高光谱特征变量与叶片叶绿素含量的相关性研究[J]. 激光生物学报 2015(05)
    • [16].农村居民对新农合的参与和支付意愿研究[J]. 南开经济研究 2017(03)
    • [17].特征变量提取方法对脐橙皮中Cu元素LIBS检测精度的影响[J]. 光谱学与光谱分析 2015(07)
    • [18].基于随机森林回归方法的水稻产量遥感估算[J]. 中国农业大学学报 2020(06)
    • [19].基于支持向量机的近红外特征变量选择算法用于树种快速识别[J]. 分析测试学报 2016(01)
    • [20].基于近红外特征变量筛选对火麻油掺杂的快速检测[J]. 福州大学学报(自然科学版) 2018(04)
    • [21].住房特征对北京各区域二手房价的影响分析[J]. 商讯 2019(17)
    • [22].农产品电商发展的增收效应研究[J]. 经济体制改革 2016(05)
    • [23].基于粗糙集的马田系统改进及其在分类中的应用[J]. 数学的实践与认识 2015(04)
    • [24].谏言行为在人口特征变量上的差异及应用[J]. 经营与管理 2013(03)
    • [25].基于支持向量机的妊娠期糖尿病预测模型的构建[J]. 安徽预防医学杂志 2019(06)
    • [26].基于Landsat 8 OLI的特征变量优化提取及森林生物量反演[J]. 遥感技术与应用 2015(02)
    • [27].特征变量数据挖掘技术助力信用卡业务智慧决策[J]. 中国信用卡 2020(11)
    • [28].QFII在中国A股市场持股特征研究[J]. 统计与决策 2011(24)
    • [29].农作物遥感分类特征变量选择研究现状与展望[J]. 资源科学 2013(12)
    • [30].基于多分Logistic回归的旅游局官博转发影响因素研究[J]. 旅游学刊 2015(01)

    标签:;  ;  ;  ;  

    关于马田系统若干问题的研究 ——以医疗数据为例
    下载Doc文档

    猜你喜欢