论文题目: 机器学习及其在多Agent对策学习中的应用研究
论文类型: 博士论文
论文专业: 系统工程
作者: 王泉德
导师: 王先甲
关键词: 多系统,机器学习,对策学习,粗糙集,关联分析,组合学习,支持向量机,决策树,强化学习
文献来源: 武汉大学
发表年度: 2005
论文摘要: 多Agent系统的理论与技术,为分布式开放系统的分析、设计和实现提供了一条崭新的途径。然而随着相关领域高新技术的迅猛发展,多Agent系统的运行环境日益趋于大型、开放、动态和不确定,迫切需要采用各种智能技术来构建具有自学习能力的Agent,为多Agent系统引入学习机制使其更好地适应复杂环境,从而导致了多Agent系统学习这一新兴研究领域的产生和迅速发展。多Agent系统学习包括采用机器学习等方法从积累的信息或数据中学习用于支持决策的知识,以及为建立多Agent协作、协调和竞争等机制而进行的对策学习。因此,机器学习方法和对策学习方法的研究对多Agent系统学习领域的发展具有非常重要的意义。 在机器学习研究领域,海量数据、复杂数据、噪声或缺值数据和极少样本等都给机器学习方法的研究带来了极大的挑战。如何提高机器学习算法处理海量数据的效率,如何提高机器学习算法的性能以处理复杂数据,如何扩展现有的机器学习算法以处理噪声或缺值数据,如何完成极少样本情况下的机器学习任务成为了机器学习研究需要重点解决的问题,也使得组合学习、强化学习、统计机器学习和针对海量数据的机器学习方法成为了机器学习研究的热点。在对策学习的研究中,采用强化学习等机器学习方法的参与人最优策略学习是最主要的对策学习方法。如何确保学习算法的理性和收敛性是研究和设计对策学习方法的关键。为此,本文对主要的机器学习方法进行了研究,提出一组扩展机器学习方法,并在理论和试验上分析了这些机器学习方法的性能。同时,探讨了机器学习方法在对策学习中的应用,研究了针对随机对策和微分对策模型的对策学习方法,设计了相应的对策学习算法并对其理性和收敛性进行了分析。主要研究工作包括: (1)将概念层次引入到粗糙集理论和关联分析中,讨论了粗糙集理论和证据理论的关系,提出了层次粗糙集模型,研究并设计了基于概念层次的数据集划分方法,以及相应的关联分析算法。层次粗糙集模型拓展了经典粗糙集理论,给出了知识的深度和广度衡量方法,在飞行器落点精度鉴定问题中的应用表明层次粗糙集模型具有更强的数据分析能力和更广的适用范围。基于概念层次的数据集划分方法利用概念层次将数据集划分成相对独立的多个子数据集,通过在各个子数据集上的关联分析来获得与整个数据集上关联分析同样的结果,并以此来提高关联分析的效率,同时该方法还有利于设计并行关联分析算法,测试结果表明了基于概念层次的关联分析方法的有效性。
论文目录:
中文摘要
Abstract
第一章 引言
1.1 机器学习方法
1.2 对策学习
1.3 本文的主要研究内容
第二章 基于概念层次的粗糙集和关联分析
2.1 概念层次
2.2 粗糙集
2.3 证据理论
2.4 信任函数的粗代数表达
2.5 基于概念层次的粗糙集
2.6 基于概念层次的粗糙集在飞行器落点精度分析中的应用
2.7 基于概念层次的关联分析
2.8 小结
第三章 基于特征约简的组合学习
3.1 组合学习方法
3.2 Bagging和Boosting组合学习方法
3.3 基于粗糙集特征约简的特征组合学习
3.4 测试和分析
3.5 小结
第四章 支持向量机决策树学习
4.1 统计学习理论和结构风险最小化原则
4.2 支持向量机
4.3 决策树学习
4.4 基于误分类代价的SVM决策树多类别分类学习
4.5 测试和分析
4.6 小结
第五章 基于状态抽象的强化学习
5.1 强化学习的任务与模型化
5.2 强化学习算法
5.3 层次强化学习
5.4 基于关联学习的层次强化学习方法
5.5 测试和分析
5.6 小结
第六章 基于组合学习的随机对策学习
6.1 矩阵对策和随机对策
6.2 随机对策学习算法的性质
6.3 随机对策的组合学习
6.4 测试和分析
6.5 小结
第七章 基于机器学习的微分对策学习
7.1 微分对策
7.2 追逃微分对策分析
7.3 追逃微分对策学习
7.4 测试和分析
7.5 小结
第八章 总结与展望
8.1 本文研究工作总结
8.2 进一步的研究工作和展望
参考文献
攻读博士学位期间的研究成果和发表的学术论文
致谢
发布时间: 2006-03-27
参考文献
- [1].基于机器学习的文本情感分类研究[D]. 张庆庆.西北工业大学2016
- [2].基于机器学习的几种医学数据处理方法研究[D]. 翁时锋.清华大学2005
- [3].基于Kernel的机器学习在建模与分类问题的应用研究[D]. 范玉刚.浙江大学2006
- [4].核机器学习方法若干问题研究[D]. 蒋刚.西南交通大学2006
- [5].基于机器学习的入侵检测技术研究[D]. 张义荣.国防科学技术大学2005
- [6].基于机器学习的编译优化适应性研究[D]. 刘章林.中国科学院研究生院(计算技术研究所)2006
- [7].机器学习与文本挖掘若干算法研究[D]. 何清.中国科学院研究生院(计算技术研究所)2002
- [8].支撑矢量机应用的关键技术研究[D]. 郑春红.西安电子科技大学2005
- [9].支持向量机在机器学习中的应用研究[D]. 罗瑜.西南交通大学2007
- [10].基于互信息与先验信息的机器学习方法研究[D]. 王泳.中国科学院研究生院(自动化研究所)2008
相关论文
- [1].多Agent系统协商中若干关键技术的研究[D]. 郭庆.浙江大学2003
- [2].多智能体模型、学习和协作研究与应用[D]. 于江涛.浙江大学2003
- [3].多Agent系统体系结构及建模方法研究[D]. 孙志勇.合肥工业大学2004
- [4].多agent协作团队的学习方法研究[D]. 王长缨.国防科学技术大学2004
- [5].核机器学习方法若干问题研究[D]. 蒋刚.西南交通大学2006
- [6].基于机器学习的入侵检测技术研究[D]. 张义荣.国防科学技术大学2005
- [7].Agent的强化学习与通信技术研究及应用[D]. 伍少成.华南理工大学2006
- [8].机器学习与文本挖掘若干算法研究[D]. 何清.中国科学院研究生院(计算技术研究所)2002
- [9].多Agent协商研究[D]. 姜丽.吉林大学2007
- [10].机器学习及其神经网络分类器优化设计[D]. 胡静.合肥工业大学2007
标签:多系统论文; 机器学习论文; 对策学习论文; 粗糙集论文; 关联分析论文; 组合学习论文; 支持向量机论文; 决策树论文; 强化学习论文;