网络处理器中处理单元的设计与实现

网络处理器中处理单元的设计与实现

论文摘要

随着网络带宽的增长以及各种应用不断涌现,网络处理器(Network Processor)作为一种采用并行可编程结构的解决方案,能够同时提供高性能和可编程能力,得到了越来越多的重视和应用。网络处理器通常采用多个同时运行的可编程的处理单元(Processing Element, PE)来取得极高的吞吐率和扩展升级能力。处理单元的微结构以及它们的拓扑组织决定了网络处理器的性能,同时也很大程度上决定了网络处理器的编程模型。本文主要研究了网络处理器中处理单元的设计和实现。通过对当前网络应用进行分析,针对网络应用的特征和硬件资源的约束选择了多个处理单元进行并行多处理的拓扑结构,设计了简洁的处理单元,并采用ASIP(Application Specific InstructionProcessor,专用指令集处理器)流程进行了原型实现和验证。同时对FPGA(FieldProgrammable Gate Array,现场可编程门阵列)以及ASIC(Application Specific IntegratedCircuits,专用集成电路)实现的硬件开销进行了分析。最后采用部分针对网络处理器的测试基准程序进行了初步的性能评估。本文设计的处理单元有以下技术特点:1)采用了MIPS I(Microprocessor withoutInterlocked Pipeline Stages,无互锁流水级微处理器)指令集,针对网络处理需求进行了裁剪,削减了部分硬件开销较大的算术逻辑运算指令以及功能部件,保持了处理单元的简洁;2)设计了类似于MIPS R2000/3000的5级流水结构,实现了流水级互锁以及气泡挤压等功能,方便了对长延迟操作进行扩展支持;3)提出了一种共享指令存贮机制,由多个处理单元共享全局多体交叉伪多端口和局部双端口,降低了冲突的概率,提高了取指带宽;4)加入了和MAC(Media Access Controller)控制器、共享存贮池、ScratchPad等部件的接口,增加了和其它处理单元进行通信同步的机制。采用Verilog HDL完成RTL(Register Transfer Level,寄存器传输级)设计之后,我们采用FPGA进行了原型验证。单个处理单元在Xilinx的2VP30平台上占用1680个4输入LUT(Look-Up Table,查找表),运行频率为86.8 MHz;采用4个处理单元构成的网络处理器原型占用300万系统门的FPGA上90%的逻辑资源,运行频率可达66.7 MHz。同时我们还对ASIC实现的开销进行了初步评估,采用UMC .18μm标准单元库进行实现,综合后频率可达350 MHz,占用面积为0.213 mm2。在片上集成18个这样的处理单元即可提供OC-48的处理能力,满足未来高速边沿汇聚的需求。原型验证的结果表明我们提出的处理单元结构简洁,消耗硬件资源较少,同时能够达到较高的运行频率,适合于采用大量处理单元的多处理结构,可以为高速的深度分组处理提供充足的处理能力。

论文目录

  • 摘要
  • 第一章 引言
  • 1.1 研究背景
  • 1.1.1 带宽驱动
  • 1.1.2 应用驱动
  • 1.1.3 网络处理器的解决方案
  • 1.2 研究现状
  • 1.2.1 处理单元的拓扑
  • 1.2.2 处理单元的结构
  • 1.3 本文的主要工作
  • 1.3.1 设计实现处理单元原型
  • 1.3.2 实现多处理单元原型系统
  • 1.3.3 系统验证和性能评估
  • 1.4 论文的组织
  • 第二章 处理单元的结构
  • 2.1 网络应用特征
  • 2.1.1 分组级并行
  • 2.1.2 任务级并行
  • 2.1.3 指令级并行
  • 2.1.4 数据级并行
  • 2.2 应用向硬件资源的映射
  • 2.3 处理单元的拓扑
  • 2.4 处理单元的选择
  • 第三章 处理单元的微结构
  • 3.1 指令集
  • 3.2 流水线
  • 3.3 功能模块
  • 3.4 存贮层次
  • 3.4.1 指令存贮
  • 3.4.2 数据存贮
  • 3.4.3 其它
  • 3.5 片上总线
  • 第四章 处理单元实现和验证
  • 4.1 ASIP设计流程
  • 4.2 处理单元实现
  • 4.3 多处理单元网络处理器原型
  • 4.4 功能验证
  • 4.4.1 基于模拟的验证
  • 4.4.2 FPGA原型验证
  • 第五章 设计方案评估和分析
  • 5.1 性能分析方法
  • 5.2 硬件开销评估
  • 5.2.1 FPGA开销评估
  • 5.2.2 ASIC开销评估
  • 5.3 运行测试基准集
  • 5.3.1 测试基准集移植
  • 5.3.2 测试基准运行结果
  • 5.4 结果评估和改进方案
  • 第六章 总结
  • 6.1 本文主要工作和贡献
  • 6.2 后续工作展望
  • 参考文献
  • 致谢
  • 作者简历
  • 相关论文文献

    • [1].一种针对多核神经网络处理器的窃取攻击[J]. 信息安全学报 2020(03)
    • [2].基于多核网络处理器的编程与设计[J]. 信息与电脑(理论版) 2013(20)
    • [3].基于多核网络处理器的时间感知整形技术研究与实现[J]. 微电子学与计算机 2019(12)
    • [4].基于网络处理器关键技术的研究与应用[J]. 电脑知识与技术 2011(09)
    • [5].最新2.4GHz ZigBee无线网络处理器实现ZigBee功能[J]. 电子设计技术 2008(06)
    • [6].网络处理器中的高速缓冲机制及其有效性分析[J]. 清华大学学报(自然科学版)网络.预览 2008(01)
    • [7].网络处理器 让国产硬件硬起来[J]. 信息安全与通信保密 2014(02)
    • [8].基于多核网络处理器平台的网络入侵检测系统方案研究[J]. 电信网技术 2012(01)
    • [9].基于多核网络处理器的高效流管理技术研究[J]. 小型微型计算机系统 2012(12)
    • [10].网络处理器技术与应用[J]. 吉林省教育学院学报 2008(08)
    • [11].基于网络处理器的网络入侵检测技术研究[J]. 河南科技 2010(15)
    • [12].基于网络处理器的负载均衡算法的研究与实现[J]. 计算机工程与应用 2008(10)
    • [13].研华新品推出96核PacketariumTM网络平台NCP-7560[J]. 国内外机电一体化技术 2010(04)
    • [14].基于众核网络处理器的用户语义识别系统[J]. 计算机技术与发展 2017(07)
    • [15].思博伦助力阿朗进行400G网络处理器测试[J]. 电信网技术 2011(10)
    • [16].RGB推出带宽节约广播网络处理器[J]. 电子与电脑 2010(04)
    • [17].新军Netronome出击高端网络处理器市场[J]. 通信世界 2008(14)
    • [18].RGB网络公司针对中国市场推出带宽节约广播网络处理器[J]. 现代电视技术 2010(04)
    • [19].德州仪器最新2.4 GHz ZigBee~无线网络处理器简化ZigBee设计并加速产品上市进程[J]. 电子技术应用 2008(06)
    • [20].TI诞生2.4 GHz ZigBee无线网络处理器[J]. 电子产品世界 2008(06)
    • [21].400G网络处理器问世 阿尔卡特朗讯借势进驻核心路由器市场[J]. 通信世界 2011(23)
    • [22].众核网络处理器下高速包转发系统设计与实现[J]. 计算机应用与软件 2016(12)
    • [23].STSTEVAL-STLKT01V1 SensorTile开发方案[J]. 世界电子元器件 2017(01)
    • [24].基于多核网络处理器的UTM设计[J]. 计算机工程与设计 2008(22)
    • [25].众核网络处理器下IPSec VPN系统设计与实现[J]. 西安工程大学学报 2016(02)
    • [26].基于多核网络处理器的骨干网DNS检测与联动[J]. 舰船电子对抗 2013(02)
    • [27].资讯[J]. 中国公共安全 2016(13)
    • [28].“中国芯”颠覆冯诺依曼架构 中国首款嵌入式神经网络处理器(NPU)“星光智能一号”诞生——全球首次成功应用于嵌入式视频监控芯片并实现量产[J]. 中国安防 2016(07)
    • [29].网络处理器IXP2850的并行运用研究[J]. 移动通信 2011(Z1)
    • [30].40nm技术,NetLogic与台积电合作[J]. 电子与电脑 2009(08)

    标签:;  ;  ;  ;  ;  

    网络处理器中处理单元的设计与实现
    下载Doc文档

    猜你喜欢