网格化内存服务体系结构研究

网格化内存服务体系结构研究

论文摘要

随着网络和数字技术的发展,快速增长的计算量和数据量对计算机的能力提出了更高的要求,而随着处理器高频和多核时代的到来,高性能计算机的频率提高日渐困难,内存瓶颈问题更加严重。同时,处理器、存储器等部件之间的紧密耦合,使得资源无法共享,限制了系统性能,提高了系统成本。网格化动态自组织计算机体系结构(Dynamic Self-organized computer Architecture based on Grid-component,DSAG)将计算机部件拆分为网格化的功能部件,打破了部件间的紧密耦合,并根据应用的需求进行动态聚合与重组,实现体系结构按需定制,并通过共享降低成本。随着光互连和可重构计算等技术的发展,实现可共享的网格化内存部件成为可能。从应用特征看,数据密集型和网络密集型应用在快速增长,数据传输的开销已经超出计算的开销。从技术方面,逻辑所占用的芯片面积相比存储越来越小,功能裁剪和部署也比存储容易。从以上两方面看,“小计算、大存储”和“数据驱动”的特征越来越明显。那么以CPU为中心的系统设计就有可能转变为以内存为中心的设计。本文基于DSAG思想、结合应用特征和技术趋势提出了以网格化内存服务为中心的系统结构(Grid Memory Service,GMS),并设计和实现了网格化内存服务器Memory Box(MBox)。具体如下:(1)提出了一种以网格化内存服务为中心的系统结构(GMS)模型。网格化内存服务是指将内存部件赋予网格化的特性,其特点是供需双方相互独立、动态请求和响应、具有一定的服务质量保证、具有统一的接口和访问模式。网格化服务模式可以解决由于处理器和内存紧密耦合带来的性能和成本问题;以网格化内存为中心的系统结构可以减小内存数据传输量,分散内存总线的压力,从而减小解决内存瓶颈的影响。针对GMS模型的特点,提出并分析了需要重点解决的关键技术问题,包括访问接口与编程模型、可扩展的架构和互连协议、智能内存和延迟隐藏等。GMS的核心部件是内存聚合体Memory Box,可以看作一种高速、大容量、智能化的多端口存储器。以Memory Box为载体,对GMS的关键技术进行研究。(2)介绍了Memory Box的访问接口和编程模型。首先对应用模式和服务模式进行了分析,为了实现统一的访问接口和服务语义,定义了网格化内存访问协议GMAP(Grid Memory Access Protocol);编程库实现了GMAP协议,供客户端程序调用。为了适应不同的应用模式,访问接口单元通过协议转换桥实现客户端网络协议和MBox内部互连协议间的转换,兼容不同类型的客户端协议。设计和实现了一个基于光互连的可重构验证系统“小雨点1号”,用以验证以内存总线为接口实现远程内存访问的可行性。“小雨点”系统实现了DDR RAM协议和自定义的互连协议间的转换,在内存接口为DDR200时,硬件带宽达到10Gbps,接近内存带宽;用户级通信带宽达到285MB/s,也接近了用benchmark测试到的内存带宽。通过测试指出有必要实现MBox内内存到内存的直接内存存取(M2M-DMA)。(3)基于光互连和串行通信技术提出了高扩展性的无背板堆叠式架构。为了实现高速、高扩展性的互连,设计和实现了一种轻量级、高带宽、低延迟、串行包交换的网格化内存互连协议GMIP(Grid Memory Interconnect Protocol)。对电互连总线和光互连总线的延迟构成做了对比分析,根据分析结果从互连协议的设计优化和互连效能两方面对消除延迟影响的方法进行了研究。针对甚短距离光互连的特点,对链路层和物理层进行了进一步优化或提出了优化原则,以简化协议模块结构、减小电路面积和功耗,进一步提高性能。链路层延迟可以降低到10个时钟周期。针对光互连的高带宽特性和光互连总线模型的特点,提出了以互连效能为评价方法,用带宽优势补偿额外延迟带来的影响,并给出了带宽和数据块大小的关系。(4)在GMS中,利用丰富廉价的嵌入式处理器和控制逻辑,可以实现分布式智能化内存。以典型应用为基础分析了以CPU为中心的系统瓶颈和以分布式智能内存为中心的处理流程,定性说明了它对分散内存总线压力、消除内存瓶颈的作用。利用智能化内存,可以实现复杂的存储管理机制和精确的系统控制,并可以利用跨层协同降低存储管理开销。分析了以智能内存为基础的主动延迟隐藏方法,提出了主动内存模型和实现方法。(5)实现了一个基于光互连的可重构的Memory Box原型验证系统,访存延迟可以达到微秒量级。利用验证平台进行测试,验证了MBox相对磁盘的性能优势,以及使用主动内存时对性能的提升效果。

论文目录

  • 摘要
  • Abstract
  • 第一章 引言
  • 1.1 DSAG体系结构
  • 1.2 内存系统的需求
  • 1.2.1 内存容量和性能的需求
  • 1.2.2 降低信息系统成本的需求
  • 1.2.3 内存系统需要适应应用特征
  • 1.3 内存系统存在的问题
  • 1.3.1 内存的性能瓶颈
  • 1.3.2 内存系统的容量瓶颈问题
  • 1.3.3 内存与处理器紧耦合带来的问题
  • 1.3.4 内存系统不能够适应应用特征
  • 1.4 网格化内存的意义
  • 1.5 网格化内存服务的可行性
  • 1.6 本文的贡献及内容组织
  • 1.6.1 本文的贡献
  • 1.6.2 本文组织
  • 第二章 相关的研究工作
  • 2.1 内存系统的性能优化
  • 2.2 智能内存
  • 2.3 非一致内存访问和分布式共享内存
  • 2.4 Memory Channel内存访问协议
  • 2.5 网络内存系统
  • 2.5.1 Anemone
  • 2.5.2 SAMSON
  • 2.5.3 NSwap
  • 2.5.4 NetramDisk
  • 2.5.5 HPBD
  • 2.5.6 网络内存总结
  • 2.6 大规模内存阵列的实现技术
  • 2.7 本章小结
  • 第三章 以网格化内存服务为中心的系统结构
  • 3.1 网格化内存服务的提出
  • 3.2 以网格化内存服务为中心的系统结构模型
  • 3.3 应用目标
  • 3.4 GMS的关键技术
  • 3.4.1 访问接口与编程模型
  • 3.4.2 可扩展的架构
  • 3.4.3 互连模型的设计
  • 3.4.4 分布式智能内存
  • 3.4.5 主动延迟隐藏
  • 3.4.6 其他问题
  • 3.5 评价方法
  • 3.6 本章小结
  • 第四章 访问接口与编程模型
  • 4.1 应用模式
  • 4.1.1 扩展本地内存,提高磁盘交换性能
  • 4.1.2 改善DSM性能
  • 4.1.3 实现快速检查点
  • 4.2 服务模式
  • 4.3 访问协议与编程模型
  • 4.3.1 网格化内存访问协议
  • 4.3.2 编程模型库
  • 4.4 访问接口单元
  • 4.4.1 访问接口单元的结构
  • 4.4.2 互连协议的转换及其测试
  • 4.5 采用内存接口的远程内存访问验证系统
  • 4.5.1 结构设计
  • 4.5.2 通信链路的实现
  • 4.5.3 客户端编程接口
  • 4.5.4 测试与评价
  • 4.6 本章小结
  • 第五章 可扩展的高速互连协议及其效能研究
  • 5.1 互连网络与互连协议概述
  • 5.1.1 高速网络技术
  • 5.1.2 甚短距离光互连技术
  • 5.1.3 GMIP的模型
  • 5.2 GMS中的互连延迟分析
  • 5.2.1 光互连总线模型
  • 5.2.2 延迟分析
  • 5.3 GMIP链路层的设计、实现与测试
  • 5.3.1 链路层设计与优化
  • 5.3.2 链路层的实现
  • 5.3.3 链路层测试与分析
  • 5.4 GMIP的物理层
  • 5.4.1 物理层的设计与实现
  • 5.4.2 光互连条件下物理层的测试、分析
  • 5.4.3 功耗分析
  • 5.5 互连效能的研究
  • 5.5.1 互连效能模型
  • 5.5.2 模拟结果与分析
  • 5.7 本章小结
  • 第六章 分布式智能内存与主动延迟隐藏
  • 6.1 利用分布式智能内存打破内存瓶颈
  • 6.1.1 以CPU中心的处理过程
  • 6.1.2 以分布式智能内存为中心的处理过程
  • 6.2 基于智能化内存的存储管理
  • 6.2.1 实现精确和复杂的内存管理
  • 6.2.2 利用跨层动态协同降低存储管理开销
  • 6.2.3 适用于MBox的存储管理算法
  • 6.3 利用主动内存机制进行延迟隐藏的研究
  • 6.3.1 主动内存访问模型
  • 6.3.2 主动内存机制的实现
  • 6.4 本章小结
  • 第七章 原型验证系统的设计与实现
  • 7.1 验证系统的组成
  • 7.2 虚拟客户端的实现
  • 7.3 控制与交换单元的实现
  • 7.3.1 控制与交换单元的结构
  • 7.3.2 协议处理
  • 7.3.3 存储管理机制
  • 7.4 内存池单元的设计
  • 7.4.1 内存板的设计
  • 7.4.2 内存板控制逻辑的设计
  • 7.4.3 内存池单元的实现
  • 7.5 Memory Box的流量控制机制
  • 7.6 访存性能测试
  • 7.6.1 基本的访存性能测试
  • 7.6.2 使用远程内存和磁盘的性能比较
  • 7.6.3 使用智能内存和不使用智能内存的性能比较
  • 7.7 本章小结
  • 第八章 结束语
  • 8.1 本文工作总结
  • 8.2 下一步工作
  • 参考文献
  • 致谢
  • 作者简介
  • 相关论文文献

    • [1].超高好评率的3款内存[J]. 计算机与网络 2020(02)
    • [2].内存和存储的应用热点与解决方案[J]. 电子产品世界 2020(02)
    • [3].为什么现在的电脑容易占内存[J]. 计算机与网络 2020(04)
    • [4].有颜实力派 HyperX Predator RGB内存[J]. 计算机与网络 2018(15)
    • [5].手机运行内存真的越大越好吗[J]. 大众用电 2017(02)
    • [6].新一代内存路在何方[J]. 个人电脑 2017(02)
    • [7].内存驱动计算对各行业意味着什么?[J]. 世界科学 2017(07)
    • [8].大数据时代内存计算先行[J]. 电子技术与软件工程 2016(09)
    • [9].内存也疯狂 HyperX Predator DDR4给你最强体验[J]. 数码摄影 2015(03)
    • [10].看图辨识真假内存[J]. 电脑爱好者(普及版) 2008(03)
    • [11].闷豆逛市场 “闷豆发飙,误解商家”[J]. 电脑爱好者 2008(11)
    • [12].升级单条4GB遇到的问题[J]. 电脑迷 2011(06)
    • [13].不是价格说了算 内存选购经验谈[J]. 现代计算机(普及版) 2008(06)
    • [14].服从新标准! 老内存超频更强大[J]. 电脑爱好者 2010(12)
    • [15].大内存时代 如何管理并使用好[J]. 电脑爱好者 2011(05)
    • [16].贪多也能嚼得烂,想用4GB以上内存的看过来[J]. 电脑爱好者 2008(08)
    • [17].菜鸟超频全攻略 内存篇[J]. 电脑迷 2008(18)
    • [18].榨干本本内存最后一滴油[J]. 电脑爱好者 2008(19)
    • [19].窄板内存能买吗?[J]. 电脑爱好者 2008(21)
    • [20].善用4GB以上内存 充分利用系统不能识别的内存容量[J]. 电脑迷 2009(02)
    • [21].图解硬件——掀起内存盖头来[J]. 电脑爱好者(普及版) 2009(05)
    • [22].内存遗失之谜 为什么我的本不能用上4GB内存?[J]. 电脑爱好者 2009(11)
    • [23].无解的后遗症! 破解4GB内存需小心[J]. 电脑爱好者 2010(23)
    • [24].请把吃掉的内存吐出来[J]. 电脑爱好者 2011(01)
    • [25].手机内存那些事 听起来高大上,然而并没什么用[J]. 电脑迷 2015(08)
    • [26].双通道及内存混插[J]. 电脑爱好者 2016(09)
    • [27].存储新篇章 详解英特尔傲腾内存[J]. 电脑爱好者 2017(11)
    • [28].N记手机为啥越用越慢[J]. 电脑爱好者 2008(18)
    • [29].用好空闲内存提高运行效率[J]. 电脑迷 2008(13)
    • [30].4G内存怎么会只显示3G可用[J]. 计算机与网络 2013(Z1)

    标签:;  ;  ;  ;  ;  ;  

    网格化内存服务体系结构研究
    下载Doc文档

    猜你喜欢