论文摘要
数字信号处理器(DSP)常常需要处理不同精度的运算。低位宽的数字信号处理器进行高精度运算时,由于需要运算的拆分,速度较慢。而在高位宽的数字信号处理器中,虽然速度快,但是用在处理低精度运算时,其效能比较低。本文提出了一种可配置的多核DSP设计方法,根据计算精度的不同,能够被配置成4个核独立运算、每2个核一起或者4个核一起拼接进行运算,在不同精度下都能保证较高的性能。课题首先改进并完成一个16位DSP、1个128位的向量ALU和1个64位的向量MAC的设计。改进数字信号处理器的数据通路设计,使用向量ALU和MAC代替传统的32位标量加法器和16位标量乘法器。在行为级、RTL级和门级电路上采用了多种低功耗技术,有效地降低了多核DSP的功耗。课题搭建了一个性能仿真环境与功耗分析平台,完成处理器的后端设计流程。8个8×8的矩阵乘法程序验证了多核架构的性能。基于Nanosim的功耗分析表明多核数字信号处理器可以低功耗的工作。
论文目录
摘要ABSTRACT第一章 概述1.1 课题背景1.1.1 不同精度的运算1.1.2 多核拼接运算1.2 数字信号处理器技术1.2.1 DSP 现状1.2.2 DSP 特点1.2.3 多核DSP1.3 论文结构第二章 低功耗技术2.1 低功耗必要性2.2 低功耗种类2.3 功耗组成2.4 低功耗技术2.4.1 门控时钟2.4.2 操作数隔离2.4.3 低功耗编码2.5 本章小结第三章 多核结构3.1 顶层结构3.2 多核译码优化3.3 多核拼接3.4 向量数据通路集成3.5 本章小结第四章 内核DSP 设计4.1 整体结构4.1.1 结构框图4.1.2 指令集4.1.3 流水线4.2 指令译码4.3 存储器访问4.3.1 存储器时序4.3.2 访存冲突4.3.3 访存旁路4.4 数据寻址方式4.5 程序寻址及条件执行4.5.1 程序寻址4.5.2 条件执行4.6 复位与策略4.7 本章小结第五章 向量数据通路设计5.1 向量ALU5.1.1 加法逻辑5.1.2 顶层结构5.1.3 中间逻辑值产生5.1.4 进位传递5.2 向量乘加器5.2.1 现有结构5.2.2 顶层结构5.2.3 部分积产生5.2.4 部分积压缩5.2.5 最终树5.2.6 最后加法器5.3 本章小结第六章 验证与测试6.1 验证平台6.2 基本指令验证6.3 应用验证6.4 测试结果6.5 本章小结第七章 结束语7.1 主要工作与创新点7.2 后续研究工作参考文献致谢攻读硕士学位期间已发表或录用的论文附件
相关论文文献
标签:多核论文; 数字信号处理器论文; 向量运算论文; 低功耗论文;