论文摘要
随着计算机技术在各学科领域中的广泛应用,尤其是在天体物理、地质、石油、气象、医学等领域产生了大量的科学数据,为了解释这些数据或者根据这些数据做出预测、判断,需要寻找一个反映数据变化规律的函数;另外,随着现代计算机技术的发展,更多的领域需要对海量数据进行处理,并对计算机处理精度和处理速度提出了更高的要求。对于给定的一批离散海量数据,如何快速得到具有最佳逼近关系的函数模型是本课题的研究重点。面对多种多样的数学模型和海量数据,进行数据拟合时都需要计算机的大量计算和内存容量,在计算机单机系统中,相对的存在内存资源不足和计算速度慢的问题,使得现有的计算机处理能力不能满足实际的需要;而并行计算能够降低单个问题求解的时间,增加问题求解规模、提高问题求解精度,是进行大规模数值计算发展的必然趋势,故本文进行数据拟合并行算法的研究,具有一定的研究意义和较大的应用价值。近年来,集群系统以其低成本、高性能的特性提供了强大的并行计算能力和批处理能力,代表了高性能计算机发展的新方向。消息传递是目前集群系统广泛使用的一种程序设计模式,MPI则是其中最受欢迎的设计平台,被应用在各个领域中。本文基于MPI在集群环境下对数据拟合并行算法进行研究和实现。本文首先通过研究基于MPI和Linux的集群系统的构建和应用,在Red Hat Linux环境下,实现了基于MPICH集群系统的构建;其次给出了线性模型数据拟合的并行算法描述,分析了该并行算法的任务分配、通信开销、负载平衡等问题。对于给定的函数集合,将该集合中的元素以全组合方式线性生成不同的函数模型,把不同的函数拟合作为不同的子任务分摊到各个节点上,每个节点独立地进行拟合求解,再把拟合结果汇集,根据一定标准选择出最佳模型,并且采用接收者启动算法——动态负载平衡策略以实现模型的分配;通过多项式拟合在PC集群环境下的实现,比较串行多项式拟合与并行多项式拟合运算时耗的差别,并分析并行算法的性能,从而探索建立集群环境对于解决海量数据多项式拟合次数范围大、运算速度过慢等问题的可行性;最后从数据的预处理及数据分割、输入输出层的确定、隐含层数及隐含层节点数的确定等方面讨论了单节点BP网络模型的构建,进行并行BP神经网络算法的研究,并分析了算法性能,给出了一定的改进设想。
论文目录
基于MPI的海量数据拟合并行算法研究摘要Abstract第1章 绪论1.1 研究背景及意义1.2 国内外研究现状1.3 论文研究内容1.4 论文组织结构第2章 并行计算机系统及并行程序设计方法概述2.1 并行计算机系统简介2.2 并行计算机系统的分类2.3 并行计算模型2.4 并行程序设计的基本模式2.5 并行程序的设计过程2.6 并行程序设计的性能度量2.7 小结第3章 基于Linux和MPI的PC集群系统的构建3.1 PC集群系统概述3.2 MPI并行程序设计3.2.1 MPI编程模式3.2.2 MPI的六个基本函数3.2.3 MPI通信方式3.3 基于Linux和MPI构建PC集群系统3.3.1 PC集群系统硬件环境的选择3.3.2 PC集群系统操作系统的选择3.3.3 PC集群系统编程环境的选择3.4 MPI程序示例3.5 小结第4章 线性模型数据拟合的并行算法研究4.1 数据拟合函数模型的确定及组合生成4.2 线性模型数据拟合的并行算法4.2.1 算法描述4.2.2 任务划分4.2.3 通信模式及通信开销4.2.4 数学模型分配——动态负载平衡4.2.5 算法性能分析4.3 多项式拟合并行算法实现及算法性能分析4.3.1 一般多项式拟合串行算法描述4.3.2 多项式拟合并行算法设计及实现4.3.3 正交多项式拟合4.3.4 实验测试分析4.3.5 程序中遇到的问题及解决4.4 小结第5章 非线性模型数据拟合的并行算法研究5.1 单节点BP网络模型的构建5.2 非线性数据拟合的BP网络并行算法5.2.1 算法描述5.2.2 算法性能分析5.2.3 算法改进5.3 小结第6章 结束语参考文献攻读学位期间发表的学术论文和研究成果致谢并行计算及数据拟合的一些问题研究第1章 并行计算机应用及国内外研究现状第2章 并行计算机系统介绍2.1 并行计算机系统简介2.2 并行计算机系统的分类第3章 基于PC集群的MPI编程环境的构建3.1 PC集群系统特点及分类3.2 PC集群系统硬件的选择与安装3.3 PC集群系统操作系统的选择3.4 PC集群系统编程环境的选择第4章 并行程序设计方法及MPI并行算法应用4.1 并行计算模型4.2 并行程序设计的基本模式4.3 并行程序的设计过程4.4 并行程序设计的调试4.5 并行程序设计的性能度量4.6 MPI并行程序设计4.6.1 MPI编程模式4.6.2 MPI的六个基本函数4.6.3 MPI通信方式4.6.4 MPI程序的执行4.7 基于MPI并行算法应用4.8 小结第5章 线性模型拟合5.1 数据拟合问题5.2 多项式线性最小二乘拟合5.3 正交多项式线性最小二乘拟合5.3.1 标准正交函数系定义5.3.2 构造正交基函数的Gram-Schmidt方法5.3.3 常用的正交多项式5.3.4 正交多项式线性最小二乘拟合步骤5.4 函数的最小二乘逼近多项式5.5 函数式自动生成5.6 线性模型拟合的并行算法第6章 非线性模型拟合6.1 问题描述6.2 常用的非线性曲线模型及线性变换6.3 迭代法6.3.1 非线性模型的直接拟合原理6.3.2 牛顿迭代法6.4 遗传算法6.5 神经网络法6.5.1 BP神经网络6.5.2 小波神经网络6.6 其他方法6.6.1 极大似然法6.6.2 模拟退火法6.6.3 缩张算法参考文献Research on Parallel Altorithm of Mass Data Fitting Based on MPIChapter 1 Introduction1.1 Background of the research1.2 the Study Status1.3 Content of Research1.4 Organizational Structure of the PaperChapter 2 Introduction of Parallel Computer System and Parallel Program Design2.1 The Introduction of Parallel Computer System2.2 The Classification of the Parallel Computer System2.3 Parallel Calculating Model2.4 The Primary Modes of Parallel Program Designing2.5 Parallel Programming Designing2.6 The Measurements of Parallel programming performance2.7 SummaryChapter 3 The MPI Programming Environment Construction in PC Clusters3.1 The Features and Classification of the PC Cluster System3.2 MPI Parallel Programming Designing3.2.1 MPI Programming Model3.2.2 Six Basic Functions of MPI3.2.3 The Communicative Way of MPI3.3 The Structures of PC Cluster Based on MPI and Linux3.3.1 The Choice of PC Cluster System Hardware Environment3.3.2 The Choice of PC Cluster System Operating System3.3.3 The Choice of PC Cluster System Programming Environment3.4 The Example of MPI Procedures3.5 SummaryChapter 4 Research on Parallel Algorithm of Data Fitting in Linear Model4.1 Determining Data Fitting Function and Generation4.2 parallel Algorithm of Data Fitting in Linear Model4.2.1 Description of the Algorithm4.2.2 Division of Tasks4.2.3 Communication Model and Cost4.2.4 Mathematical Model Distribution-Dynamic Load Balancing4.2.5 Analysis of Algorithm Performance4.3 Implementation and Performance Analysis of Polynomial Fitting Parallel Algorithm4.3.1 Description of Serial Algorithm in Universal Polynomial Fitting4.3.2 Design and Implementation of Polynomial Fitting Parallel Algorithm4.3.3 Orthogonal Polynomial Fitting4.3.4 Test Analysis of the Experiments4.3.5 Problems and Solutions Encountered in the Programs4.4 SummaryChapter 5 Research on Nonlinear Model Data Fitting of Parallel Algorithm5.1 The Construction of Single-node Neural Network Model5.2 Nonlinear Fitting the BP Data Network Parallel Algorithm5.2.1 Algorithm Description5.2.2 Algorithm Performance Analysis5.2.3 The Improvement of Algorithm5.3 SummaryChapter 6 ConclusionResearch on Some Problems of Parallel Computing and Data FittingChapter 1 Parallel Computer Applications and Study StatusChapter 2 The Introduction of Parallel Computer System2.2 The Classification of the Parallel Computer SystemChapter 3 The MPI Programming Environment Construction in PC Clusters3.1 The Features and Classification of the PC Cluster System3.2 Choosing Hardware of Cluster System3.3 Choosing Operating System of Cluster System3.4 Choosing Programming Environment of Cluster SystemChapter 4 The Design Approaches of Parallel Program4.1 Parallel Computation Model4.2 The Primary Modes of Parallel Program Designing4.3 Parallel Programming Designing4.4 Parallel Programming Debugging4.5 The Measurements of Parallel programming performance4.6 MPI Parallel Programming Designing4.6.1 MPI Programming Model4.6.2 Six Basic Functions of MPI4.6.3 The Communicative Way of MPI4.6.4 The Operation of Process4.7 Applications Based on MPI Parallel Algorithm4.8 SummaryChapter 5 Linear Model Fitting5.1 The Problem of Data Fitting5.2 Serial Algorithm in Universal Polynomial Fitting5.3 Orthogonal Polynomial Fitting5.3.1 The Standard Definition of the Orthogonal Function5.3.2 Construct Orthogonal Function with Gram-Schmidt Method5.3.3 General Orthogonal Polynomial5.3.4 Fitting Steps of Linear Least-square in Orthogonal Polynomial5.4 The Least-squares Approximation Polynomial of Function5.5 Functional Automatic Generation5.6 Linear Model Fitting Parallel AlgorithmChapter 6 Model Fitting of Nonlinear6.1 Description of the Problem6.2 Commonly Used Non-linear and Linear Model of Transformation6.3 Iteration6.3.1 The Direct Fitting Principle of Nonlinear Model6.3.2 Newton Iteration6.4 Genetic Algorithm6.5 Neural Network Method6.5.1 BP Neural Network6.5.2 Wavelet Neural Network (WNN)6.6 Other Methods6.6.1 Maximum Likelihood6.6.2 Simulated Annealing6.6.3 Contraction-Expansion Algorithm
相关论文文献
- [1].并行计算与MPI研究[J]. 无线互联科技 2017(12)
- [2].MPI并行计算应用[J]. 信息通信 2015(08)
- [3].三值光学计算机MPI编程技术在超算集群中的使用[J]. 上海大学学报(自然科学版) 2014(02)
- [4].基于ActiveX和MPI优化注射成型保压压力[J]. 模具工业 2009(05)
- [5].基于MPI的分布式水循环模型并行计算性能研究[J]. 水文 2020(05)
- [6].基于MPI的注塑模浇口位置优化设计[J]. 模具技术 2011(03)
- [7].Mpi-空间与偏序集[J]. 数学学报 2011(06)
- [8].面向MPI集合操作的定制化片上网络[J]. 计算机工程 2017(06)
- [9].基于MPI的分水岭与区域合并结合算法的并行化研究[J]. 电脑编程技巧与维护 2017(13)
- [10].基于MPI的注塑模具计算机辅助技术研究[J]. 塑料工业 2015(11)
- [11].MPI并行的节点大地电磁三维有限元正演[J]. 物探化探计算技术 2016(03)
- [12].基于天河互连MPI聚合通信归约操作卸载优化[J]. 计算机工程与科学 2020(11)
- [13].MPI技术在胶州湾水质预报系统的应用研究[J]. 计算机工程与设计 2013(06)
- [14].基于MPI的地下水数值模拟并行算法研究[J]. 安徽农业科学 2012(12)
- [15].基于MPI的并行程序设计[J]. 中国新技术新产品 2011(20)
- [16].基于MPI的注塑成型熔接痕分析及优化[J]. 机械设计与制造 2008(06)
- [17].基于可控源音频大地电磁二维反演的MPI并行算法研究[J]. 科学技术与工程 2016(31)
- [18].一种基于MPI的河流生态修复模拟并行算法[J]. 地学前缘 2014(04)
- [19].基于MPI二次开发及正交试验的注塑制品熔接痕性能的优化设计[J]. 模具技术 2012(01)
- [20].基于MPI的静态并行算法库[J]. 中国西部科技 2011(14)
- [21].基于MPI的海量数据线性拟合并行算法研究[J]. 南京师大学报(自然科学版) 2010(04)
- [22].MPI并行计算性能的研究[J]. 四川大学学报(自然科学版) 2009(06)
- [23].基于MPI和正交试验的翘曲变形研究[J]. 塑料科技 2017(11)
- [24].分布式存储系统中基于MPI的并行计算编程模型[J]. 价值工程 2012(36)
- [25].基于MPI的并行医学图像处理[J]. 计算机工程与科学 2009(03)
- [26].基于MPI的典型西南山区耕地空间分布影响因素研究——以重庆石柱县为例[J]. 水土保持研究 2014(02)
- [27].基于MPI的三维波动方程有限元法并行正演模拟[J]. 石油物探 2009(03)
- [28].一种MPI并行编程教学实验环境系统的架构[J]. 实验技术与管理 2008(04)
- [29].基于MPI百万级家庭网关模拟的设计与实现[J]. 计算机工程与设计 2017(09)
- [30].基于MPI的时间域激发极化法2.5维正则化并行反演[J]. 地球物理学进展 2015(06)
标签:海量数据论文; 集群系统论文; 并行算法论文; 数据拟合论文; 线性模型论文; 非线性模型论文;