论文题目: 基于智能网卡支持的并行通信协议的研究
论文类型: 硕士论文
论文专业: 计算机系统结构
作者: 林基
导师: 孟丹
关键词: 机群,机群,机群通信系统,并行通信技术,握手机制
文献来源: 中国科学院研究生院(计算技术研究所)
发表年度: 2005
论文摘要: 目前,以SMP服务器作为结点的机群系统被普遍采用。由于单个结点上多个CPU的使用,机群对结点间的通信带宽提出更高的要求。虽然目前的高性能通信网络得到迅速的发展,但因受物理硬件和I/O总线带宽等方面的限制,单套网络的性能仍无法满足其需求,这使得并行通信技术具有重要的意义。并行通信技术多种多样,其中以消息分片技术为主。当前并行通信中的分片机制主要是基于底层RMA通信协议之上的,而RMA通信协议本身是面向大消息的,因此并行通信只适合于大消息。虽然也可将该并行机制应用于中等长度的消息(3k至16k),但由于RMA协议中主机层握手的开销很大,使得其性能提高非常有限,而中等长度的消息一直是众多应用程序的主要消息段,因此,传统的并行通信协议依然无法满足目前的需要。为了解决这一问题,本文引入了基于智能网卡支持的并行通信协议。所谓基于智能网卡支持的并行通信协议,就是指消息发送过程中让网卡参与并行通信处理,其实质就是对MPI中的Eager协议进行并行化。由于Eager协议在发送消息前并不知道接收端的缓冲区地址,因此,为了能够正确地进行消息重组,在实现并行时引入了握手机制,通过握手返回接收端的缓冲区地址,从而可以根据该地址以及各消息分片的偏移量确定消息在接收端的存放位置。本协议吸取了RMA通信机制中主机层握手的不足之处,将握手机制下移到网卡上实现,从而缩短了握手的过程,提高了并行通信性能。本文最后对基于智能网卡支持的并行通信协议进行性能评测。在网络通信性能上,与BCL-4[41](基于RMA机制的并行通信系统)相比,它提高了3K到17K范围的通信带宽;在应用性能上,对不同的程序性能提高程度是不同的,最好的情况,如FT程序,该并行协议使执行时间减少了9.0%,而BCL-4只减少了6.6%。此外,本文分析了影响并行通信性能的主要因素,为以后的并行研究工作提供了重要的参考意见。
论文目录:
声明
关于论文使用授权的说明
摘要
Abstract
第一章 引言
第二章 机群与机群通信协议
2.1 高性能计算机的分类与发展方向
2.2 机群系统
2.2.1 体系结构
2.2.2 基本类型
2.2.3 基本特征
2.2.4 发展趋势
2.3 机群系统典型实例
2.3.1 SGI 超级服务器
2.3.2 Wolf pack 项目
2.3.3 Hot Standby 机群
2.3.4 RWCP 的Score Cluster 项目
2.3.5 Berkeley 的NOW 项目
2.4 机群通信协议
2.4.1 机群通信系统
2.4.2 机群通信协议分类
2.4.3 用户级通信协议
2.5 机群通信系统实例
2.5.1 U-net
2.5.2 SP2 MPL
2.5.3 GM
2.5.4 BIP
2.5.5 BCL
2.6 机群通信系统基本评价方法
2.7 本章小结
第三章 并行通信技术
3.1 并行通信的意义
3.2 并行通信实例简介
3.2.1 Prioritized Dispersal 技术
3.2.2 InfiniBand 并行
3.2.3 BCL-4
3.2.4 Myrinet 网卡并行
3.2.5 小结
3.3 分片机制关键问题
3.3.1 消息重组
3.3.2 接收事件合并
3.3.3 发送完成事件合并
3.4 分片机制当前进展
3.4.1 MPI 协议概述
3.4.2 基于RMA 机制的并行通信协议
3.4.3 缺点
3.5 本章小结
第四章 基于智能网卡支持的并行通信协议的实现
4.1 基于智能网卡支持的并行通信协议的引入
4.2 基于智能网卡支持的并行通信协议的基础平台
4.2.1 GM 特点
4.2.2 GM 软件结构
4.2.3 GM 通信机制
4.3 基于智能网卡支持的并行通信系统
4.3.1 特点
4.3.2 系统结构
4.3.3 软件结构
4.4 基于智能网卡支持的并行通信协议的设计
4.4.1 实现位置
4.4.2 消息传递
4.4.3 握手机制
4.4.4 时间隐藏
4.4.5 事件处理
4.4.6 网卡管理
4.5 基于智能网卡支持的并行通信协议的实现
4.5.1 底层握手实现
4.5.2 消息发送
4.5.3 发送完成事件
4.5.4 消息接收
4.6 本章小结
第五章 性能测试与分析
5.1 测试平台
5.2 点到点通信性能
5.2.1 基本测试方法
5.2.2 PCIN 系统与GM 系统的比较
5.2.3 PCIN 系统与BCL-4 系统的比较
5.3 集合通信性能
5.3.1 典型集合通信类型
5.3.2 PCIN 系统与GM 系统的比较
5.3.3 PCIN 系统与BCL-4 系统的比较
5.4 应用性能
5.4.1 NPB 介绍
5.4.2 PCIN、BCL-4、GM 三者性能比较
5.5 影响并行通信性能的因素
5.6 本章小结
第六章 结论与下一步工作
6.1 结论
6.2 下一步工作
参考文献
致 谢
作者简历
发布时间: 2006-12-26
相关论文
- [1].高速公路隧道监控系统通信协议的设计[D]. 吴发旺.西南交通大学2008
- [2].CIA网卡中支持零拷贝的高效软硬件交互机制的研究与实现[D]. 吕民强.国防科学技术大学2008
- [3].Linux环境下基于Intel千兆网卡的高速数据包捕获平台的研究[D]. 刘峰.厦门大学2008
- [4].基于VIA的网卡研究与设计[D]. 路宏涛.华中科技大学2006
- [5].基于802.10协议的链路层加密网卡研究与设计[D]. 孔令巍.解放军信息工程大学2007
- [6].Linux服务器多网卡下的负载均衡研究与实现[D]. 路明怀.国防科学技术大学2006
- [7].利用虚拟网卡实现VoIP应用的防火墙穿越[D]. 石伟兴.中国科学院研究生院(沈阳计算技术研究所)2006
- [8].基于IEEE 802.11b网卡的安全协议集成接入技术研究[D]. 段宁.西安电子科技大学2006
- [9].多网卡bonding技术的研究与实现[D]. 石磊.国防科学技术大学2005
- [10].多网卡绑定技术的研究与实现[D]. 张振锋.天津大学2004