存储层次优化论文-袁亚鹏

存储层次优化论文-袁亚鹏

导读:本文包含了存储层次优化论文开题报告文献综述及选题提纲参考文献,主要关键词:多核系统,片上网络,层次化存储,并行FIFO

存储层次优化论文文献综述

袁亚鹏[1](2018)在《面向异构多核系统的层次化存储结构设计与优化》一文中研究指出片上多核系统作为结合了多核技术与片上网络技术的产物,具有片上多处理器核与片外缓存之间数据交互频繁的先天特性,迫切需要足够高的存储器接口有效带宽,以便支撑多路数据的并行传输。传统简单的存储控制器无法同时为多个任务提供访存服务。本文借鉴多进程分时占用CPU资源这一思想,利用存储器接口与单个处理器核之间的带宽差,重新分配存储器接口带宽,实现多个访存任务在SDRAM侧分时独享、用户侧并行操作的目标。基于上述研究,本文设计实现了一种层次化存储器接口(Hierarchical Memory Interface,HMI),同时支持6路通道并行随机访存,充分释放了存储器带宽,显着提升了目标系统性能。论文的主要工作如下:1.本文首先分析了目标多核系统对HMI提出的设计需求,提出了HMI设计方案。HMI具有灵活的数据组织方式和丰富的访问模式,优化了用户输入方式,大大降低了用户编程难度;同时具有灵活的地址通道释放机制,使得任务切换更高效、指令字下发更便捷。2.其次,本文介绍了上述方案的整体架构,以及各关键模块的电路结构、功能、工作原理等。3.再次,本文从HMI的数据通道的实际问题中抽象出了一个普遍适用的多FIFO并行访存模型,并针对其资源利用率低下的情况,提出了基于RAM存储阵列的并行FIFO解决方案,该方案能够在确保性能一致的前提下,以增加部分相对较少的通用资源为代价,节省大量专用Block RAM资源,且资源消耗可预测。4.最后,本文将HMI设计集成到目标多核系统中,通过加载不同计算访存比的算法任务,测试HMI设计对系统性能的提升力度。实验结果表明,与上一版本MAMI相比,HMI接口对于零运算需求的矩阵转置等任务,性能平均提升8.97%;对于计算访存比小于1的任务,提升43.8%;对于计算访存比远大于1的任务,提升7.6%。另外,在某些应用中,HMI凭借灵活的指令输入方式,性能平均提升200%。综上,本文设计的HMI存储器接口能够有效提高数据传输并行度,提升系统性能,实现了预期目标。(本文来源于《合肥工业大学》期刊2018-03-01)

唐滔,彭林,黄春,杨灿群[2](2017)在《面向存储层次设计优化的GPU程序性能分析》一文中研究指出图形处理器凭借着比传统CPU更高的峰值性能和能效,以及日渐成熟的软件环境,逐渐成为构建异构并行系统的最流行的加速器之一。虽然GPU依靠轻量级线程的灵活切换来隐藏访存延迟,但其超高的并发度仍然给存储系统带来了很大压力,其性能的有效发挥受访存效率的强烈影响。因此GPU程序的访存行为分析及优化一直是GPU相关领域的研究热点,但很少有工作从体系结构的角度分析存储层次的设计对性能的影响。为了更好地指导GPU存储层次的设计和访存优化,从实验的角度详细地分析了GPU各存储层次对程序性能的影响,并总结出若干指导性的优化策略,为未来类似体系结构的存储层次设计和程序优化提供建议。(本文来源于《计算机科学》期刊2017年12期)

刘静[3](2012)在《面向嵌入式多核存储层次的OpenMP优化探讨》一文中研究指出在现代社会中,科学科技水平发展迅速,人们进行不断创新很大程度上是为了提高工作效率,本文介绍了计算机领域中的嵌入式多核处理器优化问题,目前市场上用的比较多的是双核和四核的CPU,而六核的CPU也已经面世多时,所以在多处理机上编写、运行并行程序也变得相当普遍,如何充分认识与利用嵌入式多核的并行计算效率已经成为目前计算机研究的一个重点工作。(本文来源于《计算机光盘软件与应用》期刊2012年12期)

王庆,季振洲,刘涛[4](2011)在《面向嵌入式多核存储层次的OpenMP优化研究》一文中研究指出当前嵌入式多核处理器的应用越来越普遍,如何充分认识与利用嵌入式多核的并行计算效率已经成为嵌入式多核并行计算的热门问题.讨论了两种不同的共享式嵌入式多核存储层次结构,即无二级共享Cache和拥有二级共享Cache的多核存储结构,在这些嵌入式多核系统中进行实际的OpenMP并行应用计算,并通过增加OpenMP对循环分块的支持来对并行程序进行数据优化.实验结果对比分析表明,在嵌入式多核中采用共享二级Cache对并行程序性能影响不大,而在对并行程序进行优化后性能平均有6%的提高.(本文来源于《计算机研究与发展》期刊2011年S1期)

王庆,季振洲,刘涛[5](2010)在《面向嵌入式多核存储层次的OpenMP优化研究》一文中研究指出当前嵌入式多核处理器的应用越来越普遍,如何充分认识与利用嵌入式多核的并行计算效率已经成为嵌入式多核并行计算的热门问题.讨论了两种不同的共享式嵌入式多核存储层次结构,即无二级共享Cache和拥有二级共享Cache的多核存储结构,在这些嵌入式多核系统中进行实际的OpenMP并行应用计算,并通过增加OpenMP对循环分块的支持来对并行程序进行数据优化.实验结果对比分析表明,在嵌入式多核中采用共享二级Cache对并行程序性能影响不大,而在对并行程序进行优化后性能平均有6%的提高.(本文来源于《2010年第16届全国信息存储技术大会(IST2010)论文集》期刊2010-12-03)

吴俊杰[6](2009)在《层次存储的访问分析与优化方法研究》一文中研究指出处理器和存储器之间的速度差距一直是计算机系统的性能瓶颈,这就是着名的“存储墙”问题。为了解决存储墙问题,几乎所有的计算机都采用层次存储系统。因此,层次存储系统的研究成为了充分发挥计算机系统性能的关键技术之一。层次存储的访问即数据访问,是连接存储墙问题中处理器和存储器的“桥梁”,因此,数据访问特性的研究是解决存储墙问题的基础。我们归纳了数据访问的六种重要性质:依赖性、重用性、相似性、亲和性、一致性和生存性。●依赖性描述了包含写访问的数据单元访问之间的相对顺序关系,约束了程序执行的正确性。●重用性描述了对同一个数据单元或相邻数据单元集合的多次访问之间的关系,是数据访问在存储层次中表现出局部性的前提。●相似性描述了程序的多个执行体中对应的多个数据单元内容之间的关系,用于优化多个执行体对存储器的占用量。●亲和性描述了数据单元在多个处理器中访问频度之间的关系,决定了数据分布对处理器访问性能的影响。●一致性描述了数据的单个或多个副本访问的数据内容之间的关系,影响着程序执行的正确性。●生存性描述了多个数据访问的活跃程度之间的关系,是资源分配类问题求解的重要约束。这六种数据访问特性相互关联、相辅相成,从不同侧面反映了数据访问的特性。我们将这六种性质分为两类,一类主要影响程序执行的正确性,对程序变换、体系结构设计等有着重要影响,包括依赖性和一致性;另一类则主要影响各种性能优化技术,是软硬件进行性能优化的依据,包括重用性、相似性、亲和性和生存性。在影响程序性能的四个性质中,重用性和相似性描述了具有资源相容特点的数据访问关系,它们分别从地址和值的角度描述了对资源的重复利用;而生存性和亲和性则描述了具有资源相斥特点的数据访问关系,它们分别从时间和空间的角度描述了对资源的互斥使用。按照正确性、性能,以及资源相容和资源相斥划分的叁组数据访问特性中,每两种性质之间分别从时间与空间、地址与值两个角度相互正交。依赖性、重用性和生存性都描述了程序执行的时间维度上的数据访问性质;一致性、相似性和亲和性则分别描述了多数据副本、多数据单元、多数据位置等空间维度上的数据访问性质。同时,依赖性、重用性和亲和性都是从数据单元的角度刻画了数据访问性质,它们的依据是数据的地址;一致性、相似性和生存性则更多地从数据内容的角度刻画了数据访问性质,它们的依据是数据的值。本文主要研究了其中的重用性、相似性和亲和性叁种性质的分析与优化方法。本文的创新工作主要体现在:1.提出了并行数据重用模型。该模型系统分析了OpenMP和OpenTM等并行程序中数据访问的重用性,给出了并行程序中数据重用的分类和求解方法。该模型将Wolf的串行数据重用模型扩展到并行领域,对面向共享存储结构的并行程序分析和编译优化技术的研究具有重要的指导意义。2.提出了面向数据对象Cache技术。通过软硬件合作管理,面向数据对象Cache技术将程序中的数据对象在Cache上进行分段管理,并为数据对象的不同重用性需求提供合适的Cache策略,包括段容量、相联度、块大小和一致性协议。实验结果表明,面向数据对象Cache技术能更好地适应多样的数据访问重用性特点,有效提高了Cache的利用率。3.提出了数据访问相似性的分析方法。该方法对程序中的差异传播进行了分类,研究了不同类型的差异传播行为,建立了差异传播模型,并通过差异传播模型给出了程序中相似数据的分析和求解方法。该方法系统、定量地研究了相似性,为面向相似性的各种编译优化技术研究奠定了重要的基础。4.提出了面向共享存储结构的相似页技术。通过编译器与操作系统的合作管理,相似页技术将相似进程间的相似数据合并到同一个物理页。实验结果表明,相似页技术有效减少了共享Cache、主存等共享存储结构中的数据占用量,优化了系统性能,提高了并行可扩展性。5.提出了数据访问亲和性的分析方法。该方法从纵直亲和度和水平亲和度两个角度对亲和性进行了定量研究,给出了纵直亲和度和水平亲和度的求解方法,给出了纵直亲和度与水平亲和度之间的定量关系,从亲和性的角度揭示了分布Cache结构研究的关键问题。该方法定量度量了亲和性,对分布存储结构下的数据分布、任务划分与调度技术等的研究具有重要的指导意义。6.提出了面向动态分布Cache的多种数据分布优化技术。针对动态分布Cache结构,分别提出了智能多跳提升技术、任意步长硬件预提升技术、软件预提升技术,以及面向共享数据竞争问题的Bank一致性技术。实验结果表明,这些技术有效优化了数据的存储位置,提高了动态分布Cache的访问性能。(本文来源于《国防科学技术大学》期刊2009-09-01)

刘国鑫,郭烈恩,贺也平,郭亮[7](2009)在《嵌入式DSP系统中SDF模型的层次化存储优化方法》一文中研究指出在同步数据流模型(SDF)描述的嵌入式数字信号处理(DSP)系统中,计算体单一出现调度(SAS)算法对于存在反馈环和数据密集处理的应用不可解或内存优化效果很差.文中提出了将SAS和Non-SAS类型调度算法相结合的层次化的存储优化方法,定义了数据密集分量和强连通分量来描述环和数据密集处理结构,并依据数据优先消耗原则设计了启发式的Non-SAS调度算法对分量进行存储优化.该方法适用于任意SDF模型,并有良好的存储优化效果.实验结果证明了其有效性.(本文来源于《计算机辅助设计与图形学学报》期刊2009年03期)

邓宇[8](2007)在《基于图着色的存储层次优化技术研究》一文中研究指出处理器与存储器的性能差距导致了“存储墙”问题的出现,使得存储系统成为计算机系统的瓶颈。从目前工艺水平和体系结构技术的发展趋势来看,这种差距还会继续增加,因此在未来可预测的范围内,对存储系统的优化将一直是提高计算机系统性能的关键技术之一。本文着重研究了如何将图着色理论应用于各级存储层次的优化问题,在cache、以流寄存器文件为代表的片上大容量寄存器文件和主存叁方面提出了创新的编译时优化方法。本文取得的主要研究成果如下:(1)提出了一个基于图着色的cache优化算法—Cache Coloring。该算法根据访存行为将程序中的数据划分成若干数据对象,然后根据数据对象的大小将cache划分为一个带有别名的伪寄存器文件,每个伪寄存器由若干cache行组成,可以容纳一个数据对象;最后使用一个经过改进的图着色寄存器分配算法来决定这些对象在cache中的位置以及发生冲突时的替换关系。数据对象的划分将cache的管理分为两个层次,一个是编译时编译器对粗粒度的数据对象的管理,另一个是运行时硬件对细粒度的cache行的管理,这样编译器和硬件的优势都得到发挥。我们构造了比传统的生命周期相干图蕴涵更多相干信息的冲突矩阵,作为处理寄存器分配冲突时的指导原则。我们基于GCC进行了实现,并通过simplescalar构造了支持CacheColoring的硬件模拟平台。实验结果表明Cache Coloring能较好的开发程序的局部性,降低cache失效率。(2)提出了一个基于图着色的流寄存器文件分配算法—SRF Coloring。该算法通过寄存器划分将流寄存器文件转换为大小和位置固定的传统寄存器文件,从而将流寄存器文件的分配问题归结为一个可以采用图着色寄存器分配算法解决的问题。针对流寄存器文件的硬件机制和程序访问流寄存器文件的特点,我们对已有的图着色算法进行了扩充,使之能够更加有效地进行流寄存器文件的分配。为了解决因流太长而导致相干图不可着色的问题,我们提出了重用优先的双缓冲策略。我们在SF95Compiler编译框架中实现了SRF Coloring。SF95Compiler是一个为FT64及其编程语言SF95开发的编译器。实验结果表明,SRF Coloring能够有效地管理流寄存器文件。(3)提出了一个基于区间着色的主存分配算法—MM Coloring。我们以数组作为分配主存空间的候选,将主存分配问题归结为区间着色问题。由于一般的区间着色问题是NP完全问题,我们利用程序所具有的一个性质,即数组生命周期的包含性来降低区间着色的难度,将一般的区间着色问题简化为超完美图的区间着色问题,并据此提出了实现最优区间着色的判定条件以及实现算法。当不满足最优区间着色的条件时,可以通过分割数组的生命周期来使之得到满足。我们提出了两种分割数组生命周期的策略。一种是自底向上的积极分割策略,它首先将数组的生命周期分割到最小,然后在满足着色条件的前提下逐步合并生命周期;另一种是自顶向下的被动分割策略,它在一开始将数组的生命周期保持为最长,只有在不满足着色条件时才选择某些生命周期进行分割。我们基于GCC进行了实现。模拟实验结果表明,该算法是一种有效的管理主存的编译方法。(本文来源于《国防科学技术大学》期刊2007-10-01)

金汉均,王晓荣,王萌[9](2007)在《基于层次包围盒的碰撞检测算法的存储优化》一文中研究指出介绍了基于层次包围盒的碰撞检测算法的存储优化方法。该方法从存储空间的角度来改进基于AABB树的碰撞检测算法。根据AABB树的构造过程,减少内部节点的AABB包围盒的存储字节数;基于快速叁角形相交测试算法,从叶节点结构里去掉包围盒信息,将叶节点从存储结构中删除。实验表明,利用AABB包围盒和叶节点的存储优化,既减少了算法的存储空间又加快了算法的执行时间。(本文来源于《计算机工程与应用》期刊2007年16期)

陆平静,车永刚,王正华[10](2006)在《基于经验搜索的多级存储层次优化》一文中研究指出存储墙是影响单机性能优化的重要因素,其缓解依赖于对程序进行存储优化。论文提出基于经验搜索的多级存储层次优化方法,将优化多级存储层次问题转化为对优化参数的经验搜索问题,并基于遗传算法选择全局最优解。实验表明,该技术可以自适应不同应用程序,大大降低存储访问时间,降低存储因素对程序性能的影响,从而有效地缓解存储墙问题。(本文来源于《计算机工程与应用》期刊2006年34期)

存储层次优化论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

图形处理器凭借着比传统CPU更高的峰值性能和能效,以及日渐成熟的软件环境,逐渐成为构建异构并行系统的最流行的加速器之一。虽然GPU依靠轻量级线程的灵活切换来隐藏访存延迟,但其超高的并发度仍然给存储系统带来了很大压力,其性能的有效发挥受访存效率的强烈影响。因此GPU程序的访存行为分析及优化一直是GPU相关领域的研究热点,但很少有工作从体系结构的角度分析存储层次的设计对性能的影响。为了更好地指导GPU存储层次的设计和访存优化,从实验的角度详细地分析了GPU各存储层次对程序性能的影响,并总结出若干指导性的优化策略,为未来类似体系结构的存储层次设计和程序优化提供建议。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

存储层次优化论文参考文献

[1].袁亚鹏.面向异构多核系统的层次化存储结构设计与优化[D].合肥工业大学.2018

[2].唐滔,彭林,黄春,杨灿群.面向存储层次设计优化的GPU程序性能分析[J].计算机科学.2017

[3].刘静.面向嵌入式多核存储层次的OpenMP优化探讨[J].计算机光盘软件与应用.2012

[4].王庆,季振洲,刘涛.面向嵌入式多核存储层次的OpenMP优化研究[J].计算机研究与发展.2011

[5].王庆,季振洲,刘涛.面向嵌入式多核存储层次的OpenMP优化研究[C].2010年第16届全国信息存储技术大会(IST2010)论文集.2010

[6].吴俊杰.层次存储的访问分析与优化方法研究[D].国防科学技术大学.2009

[7].刘国鑫,郭烈恩,贺也平,郭亮.嵌入式DSP系统中SDF模型的层次化存储优化方法[J].计算机辅助设计与图形学学报.2009

[8].邓宇.基于图着色的存储层次优化技术研究[D].国防科学技术大学.2007

[9].金汉均,王晓荣,王萌.基于层次包围盒的碰撞检测算法的存储优化[J].计算机工程与应用.2007

[10].陆平静,车永刚,王正华.基于经验搜索的多级存储层次优化[J].计算机工程与应用.2006

标签:;  ;  ;  ;  

存储层次优化论文-袁亚鹏
下载Doc文档

猜你喜欢