论文摘要
目前,以高性能计算机为基础的计算科学已经成为继理论科学和实验科学之后人类科学研究的第三大支柱,高性能计算机的影响也已经拓展到经济、公共安全和国家安全。在高性能计算机的发展中,超大规模并行处理已成为必然趋势。在大规模并行计算机中,随着处理器规模的不断增大,以及单个处理器性能的不断提升,多处理器之间经过互连网络进行通信的开销也随之大大增加。但是,传统电互连由于自身固有缺陷,包括带宽限制、阻抗不连续、时钟歪斜、电磁干扰(EMI)现象严重、功耗高、互连密度受限等,无法满足大规模并行计算机对互连网络的需求,成为阻碍系统总体性能提高的瓶颈之一。光互连因其自身特点,包括极高的传输带宽、极低的传输时延、极高的并行性、极低的功耗、通道等程、优良的网络拓扑特性等,成为大规模并行计算机互连网络研究中的热点。本文对大规模并行计算机系统中的光互连网络技术,主要是光互连网络模型,包括模型的构造理论、故障诊断方法、最优重构问题等,进行了研究。本文的主要贡献如下:①分析了传统图论在光互连网络研究中的局限性,得出了结论:由于每条边只能关联到两个结点,传统的图无法准确反映光互连网络的本质特性,基于传统图论的研究方法不能充分发掘光互连技术的潜在优势。基于以上原因,给出了一种光互连网络建模方法──基于超图理论的方法,并分析了超图理论应用在光互连网络模型研究中的优越性。②目前,光互连器件的研究已经取得了大量的成果,但与之对应的是,光互连网络模型的研究还较少,并且大多数集中在新网络模型的构造及分析,尚未涉及光互连背景下的故障诊断问题。因此,本文对光互连并行系统的故障诊断问题进行了探索性的研究,给出了超图模型下系统级故障诊断问题的相关规范及定义,从而使光互连并行系统的故障诊断可以直接借鉴传统图模型下系统级故障诊断的研究成果。③对一类典型的光互连系统─—Hypermesh的故障诊断问题进行了研究。证明了HMn,k光互连系统的一步诊断度为n(k?1)。通过将HMn,k分解为kn?cn个互不相交的、同构于HMcn,k的导出子图,{HMn,k [Vx]: x∈{k?1,···,0} n?cn},得到了HMn,k的一个圈分解CD(HC),其中cn = ?l og k (nk?k+1)?。基于这种圈分解技术,给出了一个时间复杂度为O(knn(k?1))的一步t-故障诊断算法,证明了该算法的正确性,分析了该算法的复杂度。④对一类通道可再分的智能光背板的重构问题进行了分析。通过特定条件的限定,将其中一个最优重构问题归结为经典的NP难问题──最优线性排列(OLA)问题。DNA计算有望被用于求解这类NP-难问题。基于一种DNA计算模型: Adleman-Lipton-sticker模型,给出了一个用于解OLA问题的DNA算法。对于n个结点、m条边的无向简单图G,该算法的初始解空间大小为2nK,存储链由nK + n + m + L + 1个位区组成,需要2n个试管,并通过O(n3log2 n)次试管操作完成,其中,K = ?l og 2n?, L = ?l og 2(n m)? + 1。当分子生物技术的进步足以保证DNA计算可行时,该算法就能有效地用于解决中等规模OLA问题,那时就可以通过预先编程的方式,将该算法得到的解用于控制智能光背板的重构,使互连网络资源的配置达到最优化。许多研究已经证明,光互连具有电互连无法比拟的优越性。但是,光互连要实际应用到大规模并行计算机中,还需要解决许多问题。本文只是在这方面进行了一些初步尝试,对于一些值得进一步研究的光互连网络模型问题,作者也在论文中进行了说明。可以预见,随着光电子和集成光学器件的发展,以及光互连网络的理论和技术的深入研究,光互连的总体性能优势将会逐渐体现出来,基于光互连的并行高带宽传输必将使大规模并行计算机系统的性能有相当显著的提高。“处理由电来做,传输由光来做”,将是未来高性能并行计算系统结构的主要途径之一。
论文目录
相关论文文献
标签:大规模并行计算机论文; 光互连网络论文; 系统级故障诊断论文; 最优重构论文; 计算论文;