论文题目: 基于机器学习的几种医学数据处理方法研究
论文类型: 博士论文
论文专业: 控制科学与工程
作者: 翁时锋
导师: 张长水
关键词: 机器学习,医学数据处理,分析,信息学习,非线性降维
文献来源: 清华大学
发表年度: 2005
论文摘要: 医学的发展离不开广泛的相关学科的支持。随着信息科学的发展,如何利用信息技术更好地为医学实践和医学科研服务,已经越来越为人们所关注。信息科学在医学研究,如实验设计、数据分析等方面的应用将为疾病的预防、诊断、治疗和保健提供重要的途径和手段。机器学习是当前计算机科学和信息科学的重要前沿学科之一。本文将机器学习的理论、技术和方法与医学数据处理问题相结合,开展了深入的研究,取得了以下成果:1.提出了应用于Meta分析的混合随机效应模型。该模型具有描述真实效应量复杂分布的能力,是对传统模型的重要改进。在MCMC算法框架下,设计了有效的模型参数学习算法。混合随机效应模型应用于两个尼古丁替代疗法戒除烟瘾的Meta分析任务中,发现疗效的真实效应量具有复杂的分布模式,并分析得到影响疗效的重要因素。2.提出了多变量的均值和标准差信息定量集成问题:MS信息学习。在EM框架下,设计了利用MS信息估计概率密度函数的学习算法:MSEM。模型可以用于分析不同条件下变量的分布特性;可以有效地刻画多个变量之间的统计依赖关系;可以对实验未观测指标的均值和标准差进行预测。实验广泛收集了健康个体和类风湿病患者的神经内分泌免疫系统中多种激素和细胞因子水平的MS信息,并利用MSEM算法进行深入分析,发现了一些有意义的模式。3.将非线性降维方法Isomap引入到高维医学矢量数据的处理中。在Isomap算法的基础上,建立了一种新的监督非线性降维算法:SIsomap。算法的两个版本SIsomap1和SIsomap2可分别应用于监督变量为连续属性和两类类别标签的情况。提出了基于SIsomap2和RBF神经网络的分类器设计方法。在肺癌基因数据、糖尿病病理数据等多个高维医学数据上的成功应用,证实了方法有效性。4.从机器学习的角度认识双对照重复测量数据的整体评价问题,发现该问题与模式识别问题之间的对应关系,并由此建立了一种实用的评价算法。对两组药理学重复测量数据的实验结果表明,该算法适用于多实验组、多指标、小样本的重复测量数据整体评价问题。
论文目录:
第1章 绪论
1.1 研究背景
1.1.1 医学信息学
1.1.2 循证医学
1.1.3 生物信息学
1.2 机器学习研究现状
1.3 本文的研究内容
1.4 本文主要贡献和章节安排
第2章 基于混合随机效应模型的META 分析
2.1 META 分析
2.2 效应量
2.3 META 分析中的几种统计学模型
2.3.1 固定效应模型
2.3.2 随机效应模型
2.3.3 分级贝叶斯模型
2.4 混合随机效应模型
2.5 混合随机效应模型的求解方法
2.5.1 MCMC 和Gibbs 采样
2.5.2 混合随机效应模型的参数估计
2.5.3 模型选择问题
2.5.4 置信区间的计算
2.6 实验
2.6.1 模拟实验结果
2.6.2 尼古丁代替疗法的Meta 分析
2.7 本章小结
第3章 MS 信息的学习
3.1 背景与问题描述
3.2 概率密度函数的建模
3.3 EM 框架下的MSEM 算法
3.3.1 似然函数
3.3.2 EM 方法
3.3.3 E 步骤(Expectation Step)
3.3.4 M 步骤(Maximization Step)
3.3.5 MSEM 算法
3.4 基于MSEM 的其它计算问题
3.4.1 模型选择
3.4.2 个体观察值的处理
3.4.3 条件均值和条件方差的计算
3.4.4 未观察因子的均值和标准差预测
3.5 模拟数据实验结果
3.6 HPA 轴和细胞因子的MS 数据分析
3.6.1 实验背景知识
3.6.2 实验数据
3.6.3 单个指标的实验分析
3.6.4 GMM 模型中高斯成分的意义
3.6.5 多个指标分析实验
3.6.6 预测实验
3.6.7 实验讨论
3.7 本章小结
第4章 监督非线性降维
4.1 降维与非线性降维
4.1.1 传统降维方法
4.1.2 非线性降维方法
4.2 ISOMAP 算法及其在高维医学数据分析中的应用
4.2.1 Isomap 的算法原理
4.2.2 Isomap 在高维医学数据分析中的应用
4.3 SISOMAP:监督非线性降维
4.3.1 监督非线性降维
4.3.2 SIsomap 的原理
4.4 SISOMAP 的两种实现
4.4.1 Fisher 判别分析和模糊Fisher 判别分析
4.4.2 连续变量的监督非线性降维(SIsomap1)
4.4.3 类别变量的监督非线性降维(SIsomap2)
4.5 SISOMAP 的应用
4.5.1 SIsomap 在监督数据降维中的应用
4.5.2 基于SIsomap2 的分类器设计
4.6 本章小结
第5章 PARM:一种RM 数据整体评价方法
5.1 RM 数据及其整体评价问题
5.2 PARM 的原理
5.3 PARM 的实现
5.3.1 预处理
5.3.2 两种评价准则
5.3.3 数据分布合理性检验和结果显著性检验
5.4 PARM 方法在药理学RM 数据分析中的应用
5.4.1 实验数据
5.4.2 实验结果
5.5 讨论
5.6 本章小结
第6章 结语
参考文献
致谢
声明
附录A HPA 轴和细胞因子的MS 数据的文献索引
附录B 两个药理学RM 数据的指标信息
个人简历、在学期间发表的学术论文与研究成果
发布时间: 2006-06-29
参考文献
- [1].基于机器学习的文本情感分类研究[D]. 张庆庆.西北工业大学2016
- [2].机器学习及其在多Agent对策学习中的应用研究[D]. 王泉德.武汉大学2005
- [3].基于Kernel的机器学习在建模与分类问题的应用研究[D]. 范玉刚.浙江大学2006
- [4].核机器学习方法若干问题研究[D]. 蒋刚.西南交通大学2006
- [5].基于机器学习的入侵检测技术研究[D]. 张义荣.国防科学技术大学2005
- [6].基于机器学习的编译优化适应性研究[D]. 刘章林.中国科学院研究生院(计算技术研究所)2006
- [7].机器学习与文本挖掘若干算法研究[D]. 何清.中国科学院研究生院(计算技术研究所)2002
- [8].支撑矢量机应用的关键技术研究[D]. 郑春红.西安电子科技大学2005
- [9].支持向量机在机器学习中的应用研究[D]. 罗瑜.西南交通大学2007
- [10].基于互信息与先验信息的机器学习方法研究[D]. 王泳.中国科学院研究生院(自动化研究所)2008
相关论文
- [1].医学图像处理中的机器学习方法及其应用研究[D]. 史颖欢.南京大学2013
- [2].机器学习及其在多Agent对策学习中的应用研究[D]. 王泉德.武汉大学2005
- [3].基于Kernel的机器学习在建模与分类问题的应用研究[D]. 范玉刚.浙江大学2006
- [4].核机器学习方法若干问题研究[D]. 蒋刚.西南交通大学2006
- [5].机器学习与文本挖掘若干算法研究[D]. 何清.中国科学院研究生院(计算技术研究所)2002
- [6].医学图象分析的机器学习方法[D]. 刘欣悦.中国科学院研究生院(长春光学精密机械与物理研究所)2005
- [7].生物信息学和生物信号识别领域的机器学习算法研究[D]. 王岩.吉林大学2007
- [8].机器学习及其神经网络分类器优化设计[D]. 胡静.合肥工业大学2007
- [9].基于机器学习的入侵检测方法研究[D]. 尹清波.哈尔滨工程大学2007
- [10].支持向量机在机器学习中的应用研究[D]. 罗瑜.西南交通大学2007