论文摘要
当前市场主流处理器的发展趋势是多核化/众核化,即通过提高处理器核心数目保持计算性能的持续增长。最新的图形处理器已经能够提高兆级的FLOPS理论峰值,远远超出了市场主流多核CPU。本文以国家自然科学基金项目(60803054)、浙江省自然科学基金项目(Y1100069)和AMD-浙江大学合作项目为研究背景,针对流式计算模型及其应用展开研究,主要工作包括:1、在NVIDIA CUDA平台上实现了基因序列比对的分值计算部分。本文设计实现的Diamond Tiled Wavefront算法的效率能够达到传统的Tiled Wavefront算法的1.7倍,更充分的利用GPU的并行性,更快的返回两个序列串的局部最大匹配值。2、在NVIDIA CUDA平台上实现了基因序列比对的精确比对部分。本文设计实现的流式序列比对算法首次在GPU上实现精确返回各元素的位置匹配结果。3、在ATI Stream平台上实现了三维模型凸包生成算法。在GPU上解决了CPU代码中大量应用vector、queue、map数据结构的问题。同时本文也介绍了一些用于辅助或优化上述算法实现的通用流式算法。4、在NVIDIA GeForce GTX285和ATI Radeon 5870图形处理器上使用CUDA和OpenCL实现了以上算法,并使用一系列模型进行了测试。本文算法对于基于GPU的算法加速研究具有一定的通用意义,并能延伸到其他生物计算、几何处理等领域的相关问题。
论文目录
摘要Abstract图目录表目录第1章 绪论1.1 课题背景1.2 GPU技术1.2.1 GPU发展历程1.2.2 GPU编程环境1.3 流式计算1.4 本文目标与结构1.5 本章小结第2章 GPU加速的基因序列比对Ⅰ——分值计算2.1 引言2.2 相关工作2.2.1 Smith-Waterman算法2.2.2 Wavefront算法2.2.3 Tiled Wavefront算法2.2.4 相关加速算法2.3 Diamond Tiled Wavefront算法2.3.1 相关名词2.3.2 算法概述2.3.3 计算步骤2.4 TWF和DTWF算法的比较2.4.1 时间开销2.4.2 空间开销2.5 相关流式算法2.5.1 分批处理2.5.2 取最大值2.5.3 前缀和与数据流缩减算法2.6 实验结果与分析2.6.1 实验平台2.6.2 实验结果2.6.3 结果分析2.7 本章小结第3章 GPU加速的基因序列比对Ⅱ——精确比对3.1 引言3.2 相关工作3.2.1 Hirschberg算法3.2.2 Checkpoint算法3.3 流式序列比对算法3.3.1 查找起止位置3.3.2 流式比对算法3.4 实验结果与分析3.4.1 实验平台3.4.2 实验结果3.4.3 结果分析3.5 本章小结第4章 GPU加速的三维模型凸包生成4.1 引言4.2 相关工作4.3 三维凸包CPU生成算法4.4 流式算法4.4.1 三维凸包流式生成算法4.4.2 算法流程4.4.3 Vector和Queue数据结构的实现4.4.4 Map数据结构的实现4.4.5 其他实现优化4.5 实验结果与分析4.5.1 实验平台4.5.2 实验结果4.5.3 性能分析4.6 本章小结第5章 总结与展望5.1 本文工作总结5.2 未来工作展望参考文献攻读硕士学位期间主要的研究成果致谢作者简介
相关论文文献
标签:图形处理器论文; 流式计算论文; 序列比对论文; 凸包生成论文;