多线程网络处理器分布式内核结构研究

多线程网络处理器分布式内核结构研究

论文摘要

网络介质信息传输能力的迅猛增长和网络业务复杂多样化的需求导致了网络处理器的出现。网络处理器(Network Processor,简称NP)结合了ASIC的高性能和通用CPU高可编程性两方面的优点,是推动下一代网络发展的一项核心技术。如何提升网络处理器的性能以满足主干网络节点的信息处理能力要求是网络处理器需要解决的一个关键问题。 本文受国家“十五”预研课题(专题编号:41308010307)和国家863 SOC课题(编号:2005AA1Z1196)的资助,着力对高性能网络处理器的体系结构进行深入研究。论文的主要工作和创新点如下: 1.参与完成了具有完全自主版权的片上系统“龙腾S1”的总体方案设计与实现。龙腾S1已在SMIC 0.18um工艺库上投片成功,整个SOC的晶体管数目为400万。又完成了“龙腾”S2的总体方案设计;在“龙腾”S2的总体方案设计中,完成了一个专门面向网络协议处理的32位动态多线程处理器的设计。 2.提出了一个专门针对高速网络协议处理的线程级分布式处理结构(Thread Level Distributed Processing-TLDP)。TLDP是一个多微引擎多线程结构,并支持在多个微引擎之间和每个微引擎内多个线程之间的动态调度。通过基于硬件实现的动态调度方式实现了多微引擎多线程的并行处理模式对系统程序员的透明性,有效解决网络处理器的编程复杂问题。 3.在多线程微引擎的研究中,提出了一种基于BGCG(Balanced in Group and Cyclic among Groups—BGCG)的动态多线程调度策略。隐藏了长时延操作,实现了零延时线程现场切换,无需分支预测等部件解决了微引擎的指令流水线停顿问题,提高了单个微引擎的资源利用率。单个微引擎的峰值转发速率为每秒1785千个IPV4分组或1587千个IPV6分组。 4.在TLDP体系结构的研究基础上,提出了一个基于多分支索引和间接压缩的高速路由查找与更新算法。实现了在每一个SRAM的访问延时周期内输出一个路由查找结果,在两次SRAM的读写访问延时下完成路由更新,有利于实现TLDP中的系统控制和同步处理。其综合性能可优于Stanford大学的Gupta等人提出的DIR机制和W.Degermark等人提出的SFT等机制。 5.对TLDP中多个微引擎间的全局线程调度策略进行了研究。根据网络协议处理的应用特征提出了一种自适应负载均衡的全局动态线程分派与调度策略。实现了多个协议处理微引擎之间的实时负载均衡。达到了较高的分组吞吐率,经进一步仿真统计表明在TLDP全负荷运行时,各个微引擎利用率的最大差与均值之比接近0.05。 6.使用硬件描述语言建立了TLDP的RTL级仿真模型,作者共完成了近30000

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 论文研究背景
  • 1.2 网络处理器概述
  • 1.2.1 网络处理器的产生
  • 1.2.2 网络处理器的结构与特征
  • 1.3 网络处理器的研究现状
  • 1.4 研究内容和创新点概要
  • 1.5 论文的结构
  • 第二章 网络处理器的线程级分布式处理结构
  • 2.1 网络处理器的需求分析
  • 2.1.1 网络设备对网络处理器的需求
  • 2.1.2 下一代网络的需求
  • 2.1.3 网络处理器的功能要求
  • 2.2 网络处理器内核并行技术的适应性分析
  • 2.2.1 指令级并行技术的适应性
  • 2.2.2 单片多处理器技术的适应性
  • 2.2.3 线程级并行技术及其适应性
  • 2.2.4 传统的并行结构和流水线结构及其局限性
  • 2.2.5 分布式内核结构
  • 2.3 网络处理器的线程级分布式处理结构
  • 2.3.1 TLDP结构的提出
  • 2.3.2 TLDP结构的主要部件概述
  • 2.3.3 TLDP结构的特点
  • 2.4 TLDP结构设计参数的分析
  • 2.5 小结
  • 第三章 分组处理微引擎的设计与实现
  • 3.1 指令集选择及功能分析
  • 3.1.1 网络处理器的指令集体系结构的特殊性
  • 3.1.2 Micro-engine指令集的选择
  • 3.1.3 Micro-engine指令集的操作数类型
  • 3.1.4 Micro-engine的指令类型和指令格式
  • 3.2 基于多线程技术的流水线结构设计
  • 3.2.1 多线程模式的选择分析与设计
  • 3.2.2 流水线的设计策略
  • 3.3 线程调度策略的分析与设计
  • 3.3.1 动态多线程调度策略
  • 3.3.2 零延时切换机制
  • 3.3.3 线程间同步与互斥机制的实现
  • 3.4 数据相关和控制相关的解决
  • 3.4.1 数据相关的解决策略
  • 3.4.2 控制相关的解决策略
  • 3.5 其它部件的设计及系统验证
  • 3.5.1 ALU部件的设计
  • 3.5.2 外围部件的调用
  • 3.5.3 综合实现与验证
  • 3.6 小结
  • 第四章 TLDP的路由查找引擎算法研究
  • 4.1 路由查找算法分析
  • 4.1.1 路由查找算法分类
  • 4.1.2 查找算法的性能分析
  • 4.2 基于多分支索引和间接压缩的设计方案
  • 4.2.1 路由查找处理算法
  • 4.2.2 路由更新处理算法
  • 4.3 算法的仿真验证与性能比较
  • 4.4 小结
  • 第五章 TLDP中全局负载均衡调度策略的研究
  • 5.1 负载均衡调度算法分析
  • 5.1.1 分布式系统中的调度
  • 5.1.2 负载均衡调度算法分类
  • 5.1.3 TLDP结构中的均衡调度因素分析
  • 5.2 自适应负载均衡调度策略
  • 5.2.1 动态负载均衡调度策略分析
  • 5.2.2 微引擎集合的选择调度策略
  • 5.2.3 微引擎集合的动态负载均衡策略
  • 5.3 调度策略的评价
  • 5.4 重排序缓冲区的设计
  • 5.5 小结
  • 第六章 仿真与性能评价
  • 6.1 网络处理器的性能评价方法
  • 6.2 TLDP的仿真模型
  • 6.2.1 TLDP仿真模型的建立
  • 6.2.2 与控制平面的软硬件接口
  • 6.3 TLDP的仿真与性能比较
  • 6.3.1 仿真结果
  • 6.3.2 TLDP的设计参数对仿真性能的影响
  • 6.3.3 TLDP的性能比较
  • 6.4 小结
  • 第七章 结束语
  • 7.1 本文所作的工作
  • 7.2 关于进一步的研究
  • 致谢
  • 博士期间发表的论文
  • 博士期间参加的科研工作
  • 参考文献
  • 相关论文文献

    • [1].网络处理器负载均衡中的遗传算法研究[J]. 计算机工程 2008(05)
    • [2].网络处理器自适应负载均衡调度机制[J]. 计算机应用研究 2008(04)
    • [3].自动化专业多引擎机器翻译研究[J]. 电脑知识与技术 2008(25)
    • [4].基于IXP2400平台的HASH算法研究[J]. 南京广播电视大学学报 2011(02)
    • [5].交换芯片集成可视化微引擎 让数据中心更高效[J]. 通信世界 2020(11)
    • [6].正则表达式匹配的高效硬件实现[J]. 计算机工程与科学 2009(10)
    • [7].IXP系列网络处理器的并行原理及应用[J]. 计算机工程 2008(12)
    • [8].一种图形加速器和着色器的体系结构[J]. 计算机辅助设计与图形学学报 2010(03)
    • [9].一种基于IXP1200的微码通信模块的设计方案[J]. 现代计算机(专业版) 2011(30)
    • [10].基于网络处理器的可演化路由器设计[J]. 计算机工程 2010(17)
    • [11].基于网络微处理器包过滤硬件防火墙的研究[J]. 信息化纵横 2009(06)
    • [12].IXP2400的网络测试系统的多级并行处理技术[J]. 小型微型计算机系统 2008(06)
    • [13].基于网络处理器的自相似流量仿真系统[J]. 高技术通讯 2010(04)
    • [14].网络处理器在3G防火墙中的应用[J]. 移动通信 2008(Z1)

    标签:;  ;  ;  ;  ;  ;  ;  

    多线程网络处理器分布式内核结构研究
    下载Doc文档

    猜你喜欢