基于FPGA的稀疏矩阵向量乘的优化研究与实现

基于FPGA的稀疏矩阵向量乘的优化研究与实现

论文摘要

稀疏矩阵向量乘(SMVM)运算是许多工程计算与科学计算的核心,近年来随着FPGA的广泛应用,基于FPGA平台的SMVM运算研究工作也在不断地深入。针对FPGA特有的并行性,研究者们提出了很多利用硬件逻辑实现的运算结构并且获得了比较好的运算性能。但是这些运算结构也存在着片上资源利用率低灵活性差的缺点。本文利用软硬件协同设计的思想对一种典型的硬件逻辑运算结构进行了优化,设计出了多核加协处理单元的运算结构,并且利用该结构实现了SMVM运算系统。本文首先介绍了SMVM运算研究的背景与概况,接着介绍了SMVM运算涉及到的基本概念。通过对Microblaze软核处理器FSL总线扩展的介绍,给出了利用FSL总线实现硬件加速以及多核系统的方法。然后对硬件逻辑实现的二叉树运算结构进行了分析,同时对乘法器个数为四的二叉树运算结构进行了优化,给出了多核加协处理单元的运算结构。本文在优化过程中使用了分解的方法,采用多个处理器对分解出来的协处理单元进行控制,实现了软件方式调用硬件。最后本文利用多核加协处理单元的运算结构实现了SMVM运算系统,并对该系统进行了仿真分析。

论文目录

  • 摘要
  • ABSTRACT
  • 第1章 绪论
  • 1.1 本课题的研究背景
  • 1.2 本课题的研究概况
  • 1.3 本课题的研究思路与方法
  • 1.4 本文的结构与安排
  • 第2章 相关的工作
  • 2.1 FPGA
  • 2.2 硬件描述语言Verilog HDL
  • 2.3 SOC 和SOPC
  • 2.3.1 SOC 和SOPC 概述
  • 2.3.2 软核处理器
  • 2.3.3 协处理单元
  • 2.3.4 片上多核
  • 2.4 本章总结
  • 第3章 稀疏矩阵向量乘(SMVM)的相关内容
  • 3.1 稀疏矩阵向量乘的定义
  • 3.2 稀疏矩阵的存储格式
  • 3.2.1 三元组存储格式
  • 3.2.2 CSR 存储格式
  • 3.3 稀疏矩阵中非零元素的浮点表示
  • 3.4 本章总结
  • 第4章 Microblaze 处理器的FSL 总线扩展
  • 4.1 Microblaze 处理器
  • 4.2 FSL 总线
  • 4.2.1 FSL 总线信号
  • 4.2.2 FSL 总线的操作
  • 4.3 利用FSL 总线实现硬件加速
  • 4.4 利用FSL 总线构建多核系统
  • 4.5 本章总结
  • 第5章 基于FPGA 的SMVM 运算结构的优化
  • 5.1 二叉树运算结构的分析
  • 5.2 二叉树运算结构的优化
  • 5.2.1 优化方式的选择与分析
  • 5.2.2 多核加协处理单元的运算结构
  • 5.3 本章总结
  • 第6章 基于优化结构的SMVM 运算系统的FPGA 实现
  • 6.1 实现平台与开发工具介绍
  • 6.2 SMVM 运算系统的实现流程
  • 6.3 SMVM 运算系统实现的硬件部分
  • 6.3.1 协处理单元1 与协处理单元2 的实现
  • 6.3.2 协处理单元3 的实现
  • 6.3.3 协处理单元4 的实现
  • 6.3.4 完整的硬件部分结构图
  • 6.4 SMVM 运算系统实现的软件部分
  • 6.4.1 协处理单元的驱动程序
  • 6.4.2 硬件模块之间的通信程序
  • 6.5 本章总结
  • 第7章 仿真分析与对比
  • 7.1 仿真环境的设定
  • 7.2 协处理单元性能仿真分析与对比
  • 7.3 SMVM 运算系统性能仿真分析与对比
  • 7.3.1 稀疏矩阵读取仿真分析与对比
  • 7.3.2 乘法器利用率仿真分析与对比
  • 7.3.3 硬件加速性能仿真分析与对比
  • 7.4 本章总结
  • 第8章 总结
  • 致谢
  • 硕士研究生期间的研究成果情况
  • 参考文献
  • 相关论文文献

    • [1].雅可比迭代法求解稀疏矩阵[J]. 数学大世界(上旬) 2017(05)
    • [2].低秩稀疏矩阵优化问题的模型与算法[J]. 运筹学学报 2020(03)
    • [3].基于哈夫曼编码的稀疏矩阵的存储与计算[J]. 计算机工程与科学 2013(11)
    • [4].基于动态稀疏矩阵的数据仓库模型在采购决策中的应用研究[J]. 机械管理开发 2012(04)
    • [5].基于贪婪分配的稀疏矩阵与向量乘的负载平衡[J]. 福建工程学院学报 2010(01)
    • [6].二元域大型稀疏矩阵向量乘的FPGA设计与实现[J]. 计算机工程与科学 2016(08)
    • [7].基于FPGA的稀疏矩阵向量乘的设计研究[J]. 计算机应用研究 2014(06)
    • [8].一般稀疏矩阵相乘的混合并行算法[J]. 计算机科学与探索 2013(08)
    • [9].基于稀疏矩阵字典的移动用户行为识别方法[J]. 计算机应用研究 2015(09)
    • [10].高阶矢量有限元方法中的稀疏矩阵技术[J]. 微波学报 2011(02)
    • [11].稀疏矩阵向量乘法在申威众核架构上的性能优化[J]. 计算机学报 2020(06)
    • [12].多核平台稀疏矩阵向量乘优化研究综述[J]. 科协论坛(下半月) 2009(12)
    • [13].基于伪地址存储结构的稀疏矩阵快速转置算法[J]. 工业仪表与自动化装置 2019(05)
    • [14].大规模稀疏矩阵在并行应用中的通信优化研究[J]. 计算机应用研究 2008(01)
    • [15].基于伪地址压缩存储结构的稀疏矩阵基本运算的实现[J]. 河套学院论坛 2017(03)
    • [16].工程计算中大型稀疏矩阵存储方法研究[J]. 数值计算与计算机应用 2018(03)
    • [17].一类大规模稀疏矩阵特征问题求解的并行算法[J]. 数值计算与计算机应用 2013(02)
    • [18].稀疏矩阵法网络拓扑分析[J]. 电力系统保护与控制 2011(23)
    • [19].基于图论的渠网非恒定流稀疏矩阵技术[J]. 水利学报 2011(12)
    • [20].有限元中稀疏矩阵的存储[J]. 枣庄学院学报 2008(05)
    • [21].随机稀疏矩阵链式存储结构的探讨[J]. 教育教学论坛 2017(36)
    • [22].一种用于电能质量压缩感知中的新型稀疏矩阵[J]. 电子技术 2017(10)
    • [23].稀疏矩阵向量乘的FPGA设计与实现[J]. 计算机工程 2011(23)
    • [24].基于CUDA的稀疏矩阵与矢量乘法的优化[J]. 计算机测量与控制 2010(08)
    • [25].基于用户评分和项目属性的稀疏矩阵预测研究[J]. 电脑知识与技术 2019(02)
    • [26].GPU稀疏矩阵向量乘的性能模型构造[J]. 计算机科学 2017(04)
    • [27].基于联合稀疏矩阵恢复的DOA估计算法[J]. 微波学报 2015(05)
    • [28].利用三元组稀疏矩阵技术改进HASM算法——以全球平均气温模拟为例[J]. 地球信息科学学报 2012(02)
    • [29].基于Intel Xeon Phi的稀疏矩阵向量乘性能优化[J]. 小型微型计算机系统 2016(04)
    • [30].稀疏矩阵规范网格结合物理双网格分析介质海面散射特性与试验验证[J]. 电子与信息学报 2016(02)

    标签:;  ;  ;  

    基于FPGA的稀疏矩阵向量乘的优化研究与实现
    下载Doc文档

    猜你喜欢