论文题目: 并行最优化算法与软件设计及数值软件移植
论文类型: 博士论文
论文专业: 计算机软件与理论
作者: 王建
导师: 迟学斌
关键词: 非线性共轭梯度法,无约束最优化,并行算法,并行计算,线搜索,并行程序验证,性能分析,伴随
文献来源: 中国科学院研究生院(软件研究所)
发表年度: 2005
论文摘要: 高性能计算为求解既耗时间又需要很大存储空间的大规模问题提供了强有力的工具,具有很强的实用性和高效性,并且能完成仅仅依靠个人计算机所不能达到的效果。二十年来,人们致力于研究并行最优化问题,特别是最近十年,在一些特殊的应用和对最优化问题探索更普通的并行方案中已经取得了丰硕的成果。 在实际应用中,最优化问题会以不同的形式出现,可能是线性的,也可能是非线性的,可能是有约束的,也可能是无约束的。由于最优化问题的多样性,这意味着需要设计不同的并行算法和不同的计算机体系结构来求解。目前有两个代表并行最优化领域最新研究动态的方向是:(1)问题的规模和组合本质推动设计新的全局最优化问题并行求解技术,或者针对特定的问题或者针对通用的问题,针对具体的体系结构设计适当的优化算法;(2)把并行的线性代数软件和算法封装到优化代码中,因为在最优化问题中,其中的线性代数运算占有很重要的地位。特别是实现内点技术的代码,线性代数问题对其更重要。 由于并行计算有其与串行计算不同的自身规律,研究最优化问题的并行算法,特别是大规模最优化问题的并行算法,应该考虑并行算法的本质和需要求解问题的特性。在计算问题的过程中发现,计算搜索步长花费的时间占求解一个问题60%-70%的时间,这个比例是相当可观的。如果对计算搜索步长的方法进行改进,降低在这方面的时间消耗对于求解大规模问题十分重要。围绕着并行算法的设计与实现以及并行程序的设计、调试,本文取得了如下成果: 1.本文给出了无约束最优化算法—非线性共轭梯度法(NCG)在不需线搜索(NLS)和用强Wolfe条件下以及用Goldstein非精确线搜索产生搜索步长情况下的全局收敛性证明。NLS-NCG是用一个固定的公式来计算搜索步长,而不用迭代产生搜索步长,降低了求解问题时的计算量,特别适合求解在计算搜索步长消耗很长时间的问题。 2.本文以TAO为依托,因为其解法器还不完善,本着提高其性能、扩充其解法器的目的,向其添加新的解法器—cg_dyl,cg_dy2和cg_nls_fr,通过数值试验,发现新的解法器性能较原来的有很大提高。
论文目录:
摘要
Abstract
第一章 引言
§1.1 本课题的研究意义
§1.1.1 最优化问题及其广泛应用
§1.1.2 并行求解最优化问题
§1.1.3 并行求解最优化问题的软件包
§1.2 国内外研究现状
§1.2.1 并行最优化算法的发展现状
§1.2.2 并行最优化软件的发展现状
§1.2.3 算法和软件的选择
§1.3 本文的工作
第二章 非线性共轭梯度法的全局收敛性
§2.1 引言
§2.2 NCG算法的基本框架
§2.3 W-NCG的全局收敛性
§2.4 G-NCG的全局收敛性
§2.5 NLS-NCG的全局收敛性
§2.6 CG_DY的收敛性
§2.7小结
第三章解析高级最优化工具箱(TAO)
§3.1引言
§3.2TAO的起源与现状
§3.3TAO的设计原理
§3.4TAO的核心组件
§3.4.1 程序设计技术
§3.4.2 无约束最小化解法器
§3.4.3 限界约束最优化
§3.4.4 互补问题
§3.4.5 与其它软件库的功能互用和接口
§3.5 用TAO求解问题的程序设计
§3.5.1 初始化
§3.5.2 创建TAO解法器
§3.5.3 给应用程序设定解法器
§3.5.4 定制收敛
§3.5.5 应用TAO解法器
§3.5.6 销毁TAO解法器
§3.5.7 结束TAO
§3.6 TAO的优点与不足及建议
§3.6.1 优点
§3.6.2 不足
§3.6.3 建议
第四章 解法器实现
§4.1 引言
§4.2 编写解法器
§4.3 解法器函数
§4.4 解法器的创建
§4.5 解法器的设置
§4.6 解法器的销毁
§4.7 注册解法器
§4.8 修改相应的makefile文件
§4.9 设计tao_cg_nlsgr解法器
§4.10 小结
第五章 并行非线性共轭梯度法及数值试验
§5.1 引言
§5.2 算法的并行实现
§5.3 软件设计
§5.4 算例
§5.5 数值结果
§5.6 小结
第六章 并行算法和并行程序的设计与正确性验证和调试
§6.1 引言
§6.2 并行计算基本概念
§6.3 并行算法的设计
§6.4 并行程序的设计
§6.5 并行程序的调试与分析
§6.5.1 并行程序调试
§6.5.2 并行程序性能分析
§6.6 并行程序验证
§6.6.1 规范程序的正确性(Specifying Programs Correctness)
§6.6.2 验证方法(Verification methods)
§6.6.3 验证流程
§6.7 小结
第七章 用TAO求解实际应用问题
§7.1 引言
§7.2 基本定理
§7.3 问题模型
§7.4 伴随程序编写方法
§7.4.1 伴随方法的基本介绍
§7.4.2 编写伴随程序的基本方法
§7.5 问题离散
§7.6 数值结果
§7.7 小结
第八章 结论和工作展望
§8.1 本文工作的总结
§8.2 工作展望
参考文献
附录A 基础并行软件在深腾6800上安装和调试
§A.1 引言
§A.2 fblaslapack
§A.2.1 fblaslapack简介
§A.2.2 编译、安装
§A.2.3 后处理
§A.3 PETSC
§A.3.1 PETSC简介
§A.3.2 安装机器的要求
§A.3.3 修改参数
§A.3.4 出现的问题以及解决的办法:
§A.3.5 测试例子
§A.4 TAO的安装和使用
§A.4.1 TAO简介
§A.4.2 安装的机器要求
§A.4.3 设置环境变量
§A.4.4 编译库
§A.4.5 测试例子
§A.4.6 常用的选项数据库
§A.5 SUNDIALS
§A.5.1 SUNDIALS简介
§A.5.2 设置编译器选项
§A.5.3 编译安装
§A.6 AZTEC(并行迭代解法器库)
§A.6.1 AzteC简介
§A.6.2 安装及使用
§A.7 ARPACK
§A.7.1 ARPACK简介
§A.7.2 安装和使用
§A.7.3 测试例子
§A.8 PARPACK96
§A.8.1 PARPACK96简介
§A.8.2 安装
§A.8.3 测试例子
§A.9 METIS
§A.9.1 METIS简介
§A.9.2 释放文件
§A.9.3 安装
§A.9.4 编译程序
§A.10 UMFPACK
§A.10.1 UMFPACK简介
§A.10.2 安装及使用
§A.11 DOUG
§A.11.1 DOUG简介
§A.11.2 安装和测试例子
§A.12 LAPACK
§A.12.1 LAPACK简介
§A.12.2 安装及使用
§A.13 mpiBLACS
§A.13.1 mpiBLACS简介
§A.13.2 8.12.2 mpiBLACS的安装及使用
§A.13.3 编译
§A.14 ScaLAPACK
§A.14.1 ScaLAPACK简介
§A.14.2 在深腾6800上的安装
§A.15 小结
附录B 作者简历
附录C 作者攻读博士学位期间完成及发表的论文
附录D 致谢
发布时间: 2005-07-08
相关论文
- [1].分布并行算法设计、分析与实现[D]. 张艳.电子科技大学2001
- [2].分布式存储环境下并行计算可扩展性的研究与应用[D]. 陈军.中国人民解放军国防科学技术大学2000
- [3].典型结构大型线性方程组的分布式并行算法研究[D]. 骆志刚.中国人民解放军国防科学技术大学2000
- [4].网络并行计算环境中基于多处理机任务的调度研究[D]. 黄金贵.中南大学2003
- [5].偏微分方程迭代并行解法与网格优化方法[D]. 杭旭登.中国工程物理研究院2004
- [6].分布式计算中并行I/O调度策略研究[D]. 曾碧卿.中南大学2005
- [7].单目标、多目标最优化进化算法[D]. 刘海林.华南理工大学2002
- [8].集群MPI环境下有限元结构分析并行计算研究[D]. 付朝江.上海大学2006
- [9].高效并行计算系统中的计算模型与通信网络[D]. 刘方爱.中国科学院研究生院(计算技术研究所)2001
- [10].并行程序设计模型若干问题研究[D]. 姚震.中国科学技术大学2006
标签:非线性共轭梯度法论文; 无约束最优化论文; 并行算法论文; 并行计算论文; 线搜索论文; 并行程序验证论文; 性能分析论文; 伴随论文;