嵌入式异构多核处理器设计与实现关键技术研究

嵌入式异构多核处理器设计与实现关键技术研究

论文摘要

嵌入式应用的发展要求嵌入式微处理器具有高性能、低功耗、结构可扩展、成本低和设计周期短的特征。嵌入式微处理器体系结构及设计方法因此而面临着极大的挑战。在当前集成电路工艺技术条件下,基于面向特定应用的定制处理器设计技术,开展嵌入式异构多核处理器设计与关键技术研究,是该领域的一个重要研究方向,其深入研究具有重要的理论和现实意义。本文在嵌入式异构多核处理器体系结构研究中,结合面向特定应用定制处理器的设计技术,提出了一种以定制处理器核为基础的嵌入式异构多核处理器体系结构,以期在实时性能、设计灵活性以及成本和功耗之间获取最佳的设计折衷。文中以多媒体应用为例,还重点研究了该嵌入式异构多核处理器体系结构设计与实现的核心关键技术,主要包括设计开发环境的构建、应用程序的特征分析、指令集的定制以及定制功能单元的设计等。并在上述研究工作的基础上,具体设计实现了一款面向多媒体应用的高性能嵌入式异构多核处理器芯片,验证了本文的相关研究工作。本文所取得的研究成果主要有:1.提出了一种以定制处理器核为基础的可扩展嵌入式异构多核处理器体系结构。该嵌入式异构多核处理器体系结构融合了高性能通用嵌入式处理器核和多个可面向特定应用进行定制的定制处理器核,基于传输触发体系结构的定制处理器核具有很好的可扩展特点,以及规整性和模块化特点,其硬件可以层次化自动设计实现。2.基于本文所提出的嵌入式异构多核处理器体系结构,提出了其设计实现过程中的体系结构可重定向模拟技术、指令集定制算法及硬件自动生成技术,并在此基础上建立了相应的设计开发环境,有效缩短了设计周期,对相应的嵌入式异构多核处理器的设计、实现、测试和验证提供了有力的支撑。本文使用此设计开发环境,对多媒体应用程序特征及负载进行了量化分析,得到对面向多媒体应用的嵌入式异构多核处理器设计具有指导意义的统计分析结论。3.提出并设计实现了一种基于并行加法器阵列的分散式DCT/IDCT定制功能单元体系结构。该体系结构采用了动态伸缩技术和数据分块技术,将乘法操作转变为查表操作和加法操作,再结合简单的移位操作,完成最终结果的计算。因此只需要很少数量的低位宽加法器、移位器及小规模ROM存储器,既能完成DCT/IDCT变换,并仍能保证计算结果具有很高精度。而且其结构规整,便于硬件高效实现。4.针对多媒体应用计算特点和特殊计算需求,提出并定制了子字并行指令及初等函数计算指令,设计实现了对这些定制指令进行支持的子字并行ALU,多模式子字并行乘法器以及基于CORDIC算法的初等函数计算单元。这些定制功能单元使面向多媒体应用的嵌入式异构多核处理器的实际应用性能得到了大幅度提高,用较小的芯片面积开销获取了较高的应用程序执行性能。5.在上述研究工作的基础上,设计实现了一款面向多媒体应用的嵌入式异构双核处理器EHMP-01芯片。系统研究了该处理器的设计与实现关键技术,包括微体系结构设计、存储系统设计、外围接口设计、逻辑设计和VLSI实现,以及芯片的测试和验证等。该处理器在0.18um工艺下流片,芯片总面积为4.8*4.8mm2,工作主频可以达到300MHz。在300MHz工作主频下,动态功耗仅为670mW。实际运行表明该芯片工作稳定可靠。EHMP-01嵌入式异构双核处理器芯片的成功流片,对本文提出的以定制处理器核为基础的嵌入式异构多核处理器体系结构、设计方法以及一系列关键技术进行了有效的验证。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 研究背景
  • 1.1.1 微处理器的发展趋势
  • 1.1.2 应用需求对高性能嵌入式微处理器体系结构的挑战
  • 1.1.3 设计需求对高性能嵌入式微处理器设计方法的挑战
  • 1.2 相关研究
  • 1.2.1 典型异构多核处理器体系结构
  • 1.2.2 异构多核处理器研究现状
  • 1.2.3 面向特定应用定制处理器设计方法
  • 1.3 研究内容
  • 1.4 主要工作
  • 1.5 论文结构
  • 第二章 面向特定应用的嵌入式异构多核处理器体系结构
  • 2.1 总体结构
  • 2.1.1 CC 体系结构
  • 2.1.2 可扩展的DCC 体系结构
  • 2.2 DC 体系结构
  • 2.2.1 体系结构框架
  • 2.2.2 指令集格式
  • 2.2.3 流水线机制
  • 2.2.4 功能单元及其控制机制
  • 2.2.5 寄存器文件及其控制机制
  • 2.2.6 Socket 和互连总线
  • 2.3 DC 自动生成机制
  • 2.4 多核通信机制
  • 2.5 本章小结
  • 第三章 嵌入式异构多核处理器设计开发环境
  • 3.1 软硬件自动化设计开发环境
  • 3.2 体系结构描述文件
  • 3.3 可重定向编译器
  • 3.3.1 编译器前端
  • 3.3.2 编译器后端
  • 3.4 可重定向周期精确软件模拟器
  • 3.4.1 总体结构
  • 3.4.2 处理器模型的建立
  • 3.4.3 应用程序的预解释
  • 3.4.4 并发操作的模拟
  • 3.4.5 定制指令的加入
  • 3.4.6 模拟流程
  • 3.5 指令集定制方法
  • 3.5.1 问题描述
  • 3.5.2 多层次指令集定制算法
  • 3.5.3 算法性能分析
  • 3.6 DC 自动化生成工具
  • 3.6.1 自动化设计流程
  • 3.6.2 Map Genenrator 的设计
  • 3.6.3 Mach Generator 的设计
  • 3.7 软硬件协同验证与评测体系
  • 3.7.1 评测体系的建立
  • 3.7.2 单核的独立验证与评测
  • 3.7.3 多核的协同验证与评测
  • 3.8 本章小结
  • 第四章 多媒体应用程序特性与负载分析
  • 4.1 基准测试程序集
  • 4.2 测试环境和测试方法
  • 4.3 程序特性与工作负载分析
  • 4.3.1 操作类型及比例
  • 4.3.2 整数数据宽度
  • 4.3.3 Cache 需求分析
  • 4.3.4 程序指令并行度分析
  • 4.4 分析结果对体系结构设计的影响
  • 4.5 本章小结
  • 第五章 一种改进的DCT/IDCT 算法及功能单元体系结构
  • 5.1 DCT/IDCT 硬件实现方法概述
  • 5.2 DCT/IDCT 硬件实现算法
  • 5.3 DCT/IDCT 功能单元设计关键技术
  • 5.3.1 浮点程序到定点功能单元的映射
  • 5.3.2 动态伸缩技术
  • 5.3.3 误差控制机制
  • 5.4 DCT/IDCT 功能单元体系结构
  • 5.4.1 总体结构
  • 5.4.2 数据分块判决机制
  • 5.4.3 转置存储器
  • 5.5 实验结果与分析
  • 5.5.1 DCT/IDCT 变换精度分析
  • 5.5.2 DCT/IDCT 功能单元的性能与面积分析
  • 5.6 本章小结
  • 第六章 子字并行技术及功能单元体系结构
  • 6.1 引言
  • 6.2 子字并行指令
  • 6.2.1 子字并行指令类型
  • 6.2.2 子字并行指令特性
  • 6.2.3 子字并行指令需要的硬件支持
  • 6.3 具有子字并行功能的ALU 体系结构
  • 6.3.1 ALU 体系结构
  • 6.3.2 ALU 设计中的优化技术
  • 6.4 子字并行加法器体系结构
  • 6.5 多模式可配置子字并行乘法器体系结构
  • 6.5.1 子字并行乘法器设计目标
  • 6.5.2 16 位子字并行乘法器体系结构
  • 6.5.3 32 位混合子字并行乘法器体系结构
  • 6.5.4 乘累加运算的实现
  • 6.6 实验结果与分析
  • 6.6.1 程序性能分析
  • 6.6.2 硬件实现结果与分析
  • 6.7 本章小结
  • 第七章 基于CORDIC 算法的初等函数功能单元体系结构
  • 7.1 CORDIC 算法原理
  • 7.2 基于CORDIC 算法的初等函数快速统一实现
  • 7.2.1 迭代的实现方式
  • 7.2.2 迭代次数和迭代时间的减小
  • 7.2.3 扩大可收敛输入值范围
  • 7.2.4 其他设计考虑
  • 7.3 初等函数计算功能单元体系结构
  • 7.3.1 初等函数指令
  • 7.3.2 总体结构
  • 7.3.3 前处理模块
  • 7.3.4 CORDIC 计算核心
  • 7.3.5 后处理模块
  • 7.4 实验结果与分析
  • 7.4.1 性能分析
  • 7.4.2 硬件实现结果与分析
  • 7.5 本章小结
  • 第八章 EHMP-01 处理器VLSI 实现及性能评测
  • 8.1 EHMP-01 总体结构
  • 8.2 LEON3 体系结构
  • 8.2.1 体系结构
  • 8.2.2 指令集结构
  • 8.3 Miracle 处理器核体系结构
  • 8.3.1 指令集结构
  • 8.3.2 数据通路
  • 8.3.3 功能单元
  • 8.3.4 寄存器文件
  • 8.3.5 混合存储子系统
  • 8.4 VLSI 实现结果
  • 8.4.1 前端流程
  • 8.4.2 后端流程
  • 8.4.3 测试和验证
  • 8.5 性能评测
  • 8.6 本章小结
  • 结束语
  • 致谢
  • 参考文献
  • 作者在学期间取得的学术成果
  • 相关论文文献

    • [1].面向多媒体及通信等领域的多核处理器[J]. 技术与市场 2015(02)
    • [2].多核处理器关键技术分析[J]. 大众投资指南 2019(06)
    • [3].最数字[J]. 飞碟探索 2016(07)
    • [4].一种有效的多核处理器计算模型设计与分析[J]. 信息与电脑(理论版) 2013(22)
    • [5].支持多核处理器的星载分区操作系统设计[J]. 航天器工程 2020(01)
    • [6].多核处理器发展趋势及关键技术[J]. 计算机工程与设计 2018(02)
    • [7].异构多核处理器体系结构分析[J]. 大众投资指南 2019(07)
    • [8].多核测试利器 CINEBENCH[J]. 电脑迷 2008(14)
    • [9].多核处理器调度方法研究[J]. 科技致富向导 2011(17)
    • [10].嵌入式智能计算扩展多核处理器市场空间[J]. 电子产品世界 2014(05)
    • [11].虞志益:引领多核处理器创新之路[J]. 中国发明与专利 2013(01)
    • [12].多核处理器的关键技术及其发展趋势[J]. 计算机工程与设计 2009(10)
    • [13].多核处理器及其对系统结构设计的影响[J]. 计算机科学与探索 2008(06)
    • [14].多核处理器的软件优化[J]. 新电脑 2008(05)
    • [15].AMD引爆真多核处理器平民时代 AMD Phenom X3解析[J]. 现代计算机(普及版) 2008(05)
    • [16].基于多核处理器的网络安全协议并行处理研究[J]. 信息网络安全 2011(09)
    • [17].Wind River RDC 2008聚焦多核开发新机遇[J]. 电子设计应用 2009(01)
    • [18].前言:嵌入式多核处理器系统及视频信号处理技术研究进展[J]. 南京大学学报(自然科学版) 2009(01)
    • [19].视频多核处理器结构[J]. 清华大学学报(自然科学版) 2008(01)
    • [20].性能不对称多核处理器负载均衡调度研究[J]. 计算机工程与科学 2013(11)
    • [21].基于同构多核处理器的任务调度[J]. 计算机系统应用 2014(11)
    • [22].基于多核处理器的程序性能优化方法[J]. 巢湖学院学报 2012(03)
    • [23].基于多核处理器的多任务并行处理技术研究[J]. 计算机应用与软件 2012(07)
    • [24].多核处理器任务调度的思考[J]. 计算机光盘软件与应用 2012(18)
    • [25].多核处理器中任务调度与负载均衡的研究[J]. 微电子学与计算机 2011(11)
    • [26].异构多核处理器分支预测器研究与设计[J]. 微电子学与计算机 2011(11)
    • [27].异构多核处理器的任务调度算法[J]. 计算机工程与应用 2009(33)
    • [28].基于多核处理器的深度包检测的实现和性能评估[J]. 电信科学 2009(S2)
    • [29].一种分片式多核处理器的用户级模拟器[J]. 软件学报 2008(04)
    • [30].基于多核处理器并发计算软件构架设计与实现[J]. 计算机科学 2008(07)

    标签:;  ;  ;  ;  ;  ;  ;  ;  

    嵌入式异构多核处理器设计与实现关键技术研究
    下载Doc文档

    猜你喜欢