论文摘要
基于超长指令字的DSP一般都具有多条指令同时发射、多个功能部件同时执行的特点,要求寄存器文件具备多个读写端口以满足功能部件对寄存器文件的同时访问。提高性能、降低功耗、减小面积是多端口寄存器文件设计的关键。本文根据XDSP的结构确定了寄存器文件的设计要求,对多端口寄存器文件的全定制设计和实现技术进行了研究。本文的主要工作和贡献集中体现在以下几个方面:对结构和电路进行优化,提高了寄存器的性能。把读寄存器、运算、写回安排在不同的流水站中,缩短了关键路径。利用时钟偏斜进行了优化,用正向时钟偏斜来提高电路性能。存储内核采用动态读电路和静态推拉结构的写电路来提高读写速度,译码器采用两级静态译码结构并用基于逻辑努力的方法进行优化,减少了11.1%的译码时间。定向通路中使用了低阈值技术把延时降低了27.3%。采用门控时钟、多阈值技术、反相读出、多级译码、动静转换等技术降低功耗。所有端口同时工作读端口都读全1时的功耗最大,为52mW,小于同等规模的寄存器文件。采用端口复用技术减少了版图面积。根据长型数据访问的特点采用了端口复用分体布局技术,将存储阵列中端口数目和译码器数目减少了7个,并完成了与端口复用相关的模块设计,使得寄存器面积最终减少了19%。对更多端口的寄存器文件进行了研究,讨论了端口数目的增加对存储内核性能的影响,提出了一种改进的字线共享存储内核结构,使得读写延时随端口数目的增长率分别减少了32.9%和4.9%。本文在0.13μm工艺下完成了一个具有13个读端口9个写端口,容量为32×32位、能够在单周期内完成数据写入并读出、含有定向通路的寄存器文件。该寄存器文件在X高频DSP数字信号处理器中流片,频率可以达到625MHz。
论文目录
摘要ABSTRACT第一章 绪论1.1 高性能DSP 及其寄存器文件概述1.1.1 高性能DSP1.1.2 寄存器文件概述1.2 寄存器文件的相关研究1.3 全定制设计方法1.4 本文工作及意义1.5 论文结构第二章 X 高频DSP 寄存器文件总体设计2.1 X 高频DSP 概述2.2 X 高频DSP 的寄存器文件2.2.1 支持数据类型2.2.2 读写端口2.2.3 读写时序安排2.3 寄存器文件的总体结构2.4 端口复用2.5 小结第三章 寄存器文件电路设计与优化3.1 存储电路设计与优化3.1.1 电路结构3.1.2 性能优化3.1.3 噪声优化3.2 译码器设计与优化3.2.1 基于逻辑努力的优化方法3.2.2 使能转换电路设计与优化3.2.3 译码电路设计与优化3.3 写数据选择电路设计3.4 读数据选择电路设计3.5 定向通路设计与优化3.5.1 译码模块电路设计3.5.2 数据选择模块3.6 小结第四章 时钟网络设计与分析4.1 时钟网络介绍4.2 时钟偏斜4.2.1 时钟偏斜分析4.2.2 时钟偏斜优化4.3 门控时钟4.4 关键电路4.4.1 脉冲产生电路4.4.2 延时电路4.5 控制时钟的分析4.6 小结第五章 寄存器文件的版图设计5.1 版图设计5.2 版图优化5.2.1 紧凑版图技术5.2.2 可靠性优化5.2.3 参数调整5.3 版图验证5.4 版图后模拟5.5 小结第六章 验证与分析6.1 测试码的开发6.1.1 译码测试6.1.2 写端口测试6.1.3 存储测试6.1.4 读端口测试6.1.5 写后读测试6.1.6 定向通路测试6.2 功能验证6.3 功耗分析6.3.1 功耗原因6.3.2 低功耗技术6.4 性能分析6.5 小结第七章 更多端口寄存器文件的研究7.1 背景7.2 字线共享技术7.3 寄存器文件合并7.3.1 端口数目确定7.3.2 性能分析7.3.3 译码器的设计7.4 小结第八章 结束语8.1 全文工作总结8.2 未来的研究方向致谢参考文献作者在学期间取得的学术成果
相关论文文献
标签:寄存器文件论文; 多端口论文; 全定制论文; 端口复用论文; 字线共享论文; 定向通路论文;