“银河飞腾”DSP片内存储系统的优化设计研究

“银河飞腾”DSP片内存储系统的优化设计研究

论文摘要

数字信号处理器(DSP)自问世以来得到了快速的发展和广泛的应用。片内存储子系统的安排,对DSP的性能影响甚大。Cache虽有着失效延迟难以预测、不能很好满足实时性要求等缺点,但因与DSP算法极好的契合性而依然是高性能DSP芯片设计不可缺少的重要技术之一。因此,研究合适的基于Cache的DSP的存储系统具有重要的意义。 YHFT-DSP课题组研制的“银河飞腾”系列DSP芯片采用了“片内RAM+两级Cache”的存储结构,融合了RAM和Cache的优点,具有良好的可扩展性,但存在着片内外间数据传输效率较低、Cache失效延迟偏大等不足。 本文在广泛研究当前主流高性能DSP芯片的存储结构文后,深入分析了YHFT-Dx片内存储系统的特点,提出了增大存储器容量、优化部件间接口协议等几种提高存储系统性能的改进方法,并完成了优化设计的RTL级编码及模拟验证,最后还进行了性能评测。 根据YHFT-Dx二级存储器可配置成Cache/RAM的特点,直接将其从64kB扩大到256kB,增加的192kB专做RAM使用。增大RAM使得可以在片内放入更多的代码和数据,从而减小二级存储器的失效率。评测发现,改进后存储系统的性能提高了约15%。 为了减小YHFT-Dx二级Cache的失效延迟,在已增设的1,2与外部存储器接口(EMIF)直接通路基础上进一步优化了接口协议,并通过在EMIF与L2之间、一级数据Cache与L2之间设置写回缓冲和优先供给请求字,大大提高了Cache系统的性能。这些改进使得YHFT-Dx存储系统的整体性能提高了约9%以上。提出的基于Cache行地址偏移量的优先读取方法不仅减小了Cache的失效延迟,而且使得延迟变得较为确定。 针对YHFT-Dx中EDMA(增强的直接存储器访问)在片内外间数据搬移效率较低这一缺点,优化了L2、EDMA和EMIF之间的接口协议。通过增加使用缓冲器实现了EDMA读/写操作的流水化,提高了并行处理能力,隐藏了存储器的访问延迟。这一改进使得EDMA数据搬移的效率提高了60%多。 为了保证设计的正确性为所做优化设计开发了较为完备的测试码,并完成了功能验证和时序验证。这些优化设计在已投片的YHFT-D4B中得到了实际应用。

论文目录

  • 图目录
  • 表目录
  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • §1.1 DSP芯片概述
  • §1.1.1 DSP芯片的特点
  • §1.1.2 DSP芯片的发展趋势
  • §1.2 DSP的片内存储体系结构
  • §1.2.1 DSP片内存储器的结构与层次
  • §1.2.2 DSP片内Cache的使用与组织
  • §1.2.3 高性能DSP片内存储系统的发展趋势
  • §1.3 相关研究
  • §1.4 课题的来源、目标及研究意义
  • §1.5 本文所作的研究工作
  • §1.6 论文的组织结构
  • 第二章 YHFT-Dx的存储结构及性能优化途径
  • §2.1 YHFT-Dx总体结构
  • §2.2 YHFT-Dx的片内存储子系统
  • §2.2.1 存储访问的数据通路
  • §2.2.2 片内两级Cache结构
  • §2.3 YHFT-Dx片内存储系统的性能优化途径分析
  • §2.3.1 提高数据传输效率的一般方法
  • §2.3.2 提高Cache性能的一般方法
  • §2.3.3 提高YHFT-Dx数据传输效率和Cache性能的技术途径
  • §2.4 小结
  • 第三章 增大片内存储器容量的设计
  • §3.1 64kB的L2 Cache/RAM结构
  • §3.2 192kB RAM+64kB Cache/RAM结构
  • §3.3 增大存储器容量带来的问题
  • §3.4 存储器内建自测试
  • §3.5 小结
  • 第四章 YHFT-Dx片内存储系统的优化设计
  • §4.1 L2—EMIF直接存取通路的设计与优化
  • §4.1.1 L2—EMIF直接存取通路
  • §4.1.2 L2—EMIF直接存取通路的优化
  • §4.2 使用写回缓冲
  • §4.2.1 L1D与L2间失效写缓冲的设计
  • §4.2.2 L2与EMIF间写回缓冲的设计
  • §4.3 优先供给请求字
  • §4.3.1 L2与L1D间优先供给请求字
  • §4.3.2 EMIF与L2间优先供给请求字
  • §4.4 EDMA读写操作的流水化
  • §4.4.1 YHFT-Dx EDMA简介
  • §4.4.2 L2与EDMA的接口
  • §4.4.3 EDMA读写操作的流水化设计
  • §4.5 小结
  • 第五章 模拟验证
  • §5.1 验证方法与策略
  • §5.2 增大L2 RAM容量的模拟验证
  • §5.3 L2—EMIF直接存取通路的模拟验证
  • §5.4 写回缓冲的模拟验证
  • §5.5 请求字优先的模拟验证
  • §5.6 EDMA读写操作流水化的模拟验证
  • §5.7 小结
  • 第六章 性能评测和实验结果
  • §6.1 性能评测的方法
  • §6.2 增大L2 RAM容量的性能分析和实验统计结果
  • §6.3 L2—EMIF直接存取通路的性能分析和实验统计结果
  • §6.4 写回缓冲的性能分析和实验统计结果
  • §6.5 请求字优先的性能分析和实验统计结果
  • §6.6 EDMA读写操作流水化的性能分析和实验统计结果
  • §6.7 YHFT-Dx存储系统整体优化的性能分析和实验统计结果
  • §6.8 小结
  • 第七章 结束语
  • §7.1 工作总结
  • §7.2 工作展望
  • 致谢
  • 硕士研究生期间发表的论文
  • 参考文献
  • 相关论文文献

    • [1].基于集中式架构的高速率大容量测量存储系统设计[J]. 电子技术与软件工程 2020(07)
    • [2].试议存储系统安全[J]. 电脑编程技巧与维护 2020(06)
    • [3].大数据环境下的存储系统构建:挑战、方法和趋势[J]. 大数据 2019(04)
    • [4].密集存储系统及其市场需求分析[J]. 物流技术与应用 2018(09)
    • [5].数据中心存储系统故障了怎么办[J]. 计算机与网络 2018(21)
    • [6].网络编码云存储系统差分数据更新方案[J]. 通信学报 2017(03)
    • [7].基于磁盘和固态硬盘的混合存储系统研究综述[J]. 计算机应用 2017(05)
    • [8].公有云存储系统性能评测方法研究[J]. 计算机应用 2017(05)
    • [9].安全云存储系统综述[J]. 科技视界 2017(05)
    • [10].移动云存储系统的关键问题与技术方案[J]. 福建电脑 2017(08)
    • [11].一种云存储系统分层性能监测和采集方法[J]. 西北工业大学学报 2016(03)
    • [12].基于开放云存储协议的云存储系统性能评测方法研究[J]. 电子设计工程 2016(19)
    • [13].一种云存储系统安全扩展框架设计[J]. 黑龙江科技信息 2014(31)
    • [14].云存储系统的分析与应用[J]. 信息技术与信息化 2014(07)
    • [15].云存储系统性能评测技术研究[J]. 计算机研究与发展 2014(S1)
    • [16].网络化存储系统在大数据时代应用与探讨[J]. 网络安全技术与应用 2015(05)
    • [17].分布式的电力云存储系统的优势分析和可行性研究[J]. 通讯世界 2015(12)
    • [18].医院PACS云存储系统建设途径[J]. 数码世界 2020(01)
    • [19].企业级蓝光归档存储系统[J]. 湖北画报(上旬) 2017(03)
    • [20].高端存储系统专题(之一) 高端存储系统发展展望[J]. 科技浪潮 2014(01)
    • [21].能源存储系统的类型和特点[J]. 信息技术与标准化 2013(09)
    • [22].虚拟化环境下存储系统的改进方法探索[J]. 成都航空职业技术学院学报 2013(04)
    • [23].云存储系统的分析与应用研究[J]. 计算机光盘软件与应用 2013(24)
    • [24].云存储系统的分析与应用探讨[J]. 数字技术与应用 2013(10)
    • [25].基于融合存储系统的数据容灾[J]. 现代计算机(专业版) 2013(34)
    • [26].融媒体云中心存储系统设计[J]. 广播电视信息 2020(05)
    • [27].子母穿梭车密集存储系统货位分配研究[J]. 制造业自动化 2020(06)
    • [28].面向大数据异构系统的神威并行存储系统[J]. 大数据 2020(04)
    • [29].密集存储技术及其应用[J]. 物流技术与应用 2018(09)
    • [30].基于块的分级存储系统多样性机制设计与研究[J]. 计算机工程 2016(12)

    标签:;  ;  ;  

    “银河飞腾”DSP片内存储系统的优化设计研究
    下载Doc文档

    猜你喜欢