论文题目: 基于SMP的线程轻化相关研究
论文类型: 硕士论文
论文专业: 计算机系统结构
作者: 张文力
导师: 樊建平
关键词: 线程,轻化,调度,并行模拟器,服务器
文献来源: 中国科学院研究生院(计算技术研究所)
发表年度: 2005
论文摘要: 约50年的并行计算历程中,从处理机内部指令集并行到集群尺度上的并行,都在现有计算能力的基础上,极大的开发了计算的潜能。随着线程应用日益广泛,体系结构、编译技术、编程模型、线程库等层面都在朝向更高并行度、更细并行粒度方向发展。同时,对网络信息服务类海量并发细粒度应用而言,利用传统线程不能如期获得SMP上的加速,而随着CMP和SMT的进展,线程开销的优化更是提上了日程。为此,本文围绕优于传统Posix线程的合适的调度粒度和相应高效低开销的调度切换技术展开讨论,以提高细粒度并行下资源的有效利用率。主要工作如下:基于pthread线程全面分析与开销测试,实验定量分析出pthread线程微秒级开销下同步粒度与多处理机上性能加速的关系:在相当于线程切换开销十倍量级的同步粒度下,执行流在多处理机上很难获得有效的性能提高,进而指出细粒度并行性能一定程度上受制于线程自身开销的问题。针对细粒度并行线程开销敏感问题,提出了资源自封闭体和主动调度机制,设计并开发了独立于操作系统的高效低开销调度模块。该调度模块兼顾核心级线程真正并行、用户级线程开销小的优点,可根据应用特征进行用户级调度,有效地减少了调度和切换开销,可高效实现每秒十万次级别的切换频度。初步达成线程粒度和切换开销的轻化,克服了细粒度并行应用在多处理机上利用标准线程无法有效获得加速的弊端。此外,该调度模块实现不改变操作系统核心的情况下有效利用多处理机,可广泛适用于此类相关度不大的细粒度并行应用。进一步,利用资源自封闭体的构造和该调度模块成功改善了并行模拟器SandFox的实际性能,获得了较标准线程库pthread实现而言几倍的提高。对于建立的高密度访问Web服务器模型,由于在微秒级同步粒度情况下,有至少30%以上的开销浪费于调度切换,应用轻化手段后如期获得CPU有效利用率的大幅提高。从而为网络信息服务类海量并发细粒度应用的性能提高研究提供了新的解决思路。另外,本文还分析了Linpack、NPB等常用并行应用,试图为线程轻化作应用特征准备。作为辅助分析,编写了误差精度在5%以内的Linpack仿真模型。利用该模型获得的详细开销数据表明,Linpack等常用高性能应用不适于轻化,文末给出总结以备后续轻化工作参考。
论文目录:
摘 要
Abstract
第一章 引言
1.1 基于SMP 的并行研究现状
1.1.1 内核并行运行多进程、多线程存在的问题
1.1.2 对上述问题已有的解决思路及方法
1.2 国际前沿细粒度并行处理技术跟踪
1.3 细粒度并行研究的意义
1.4 本文的贡献
1.5 论文的组织
第二章 线程分析与测试
2.1 线程的由来
2.2 线程的优势与缺陷
2.3 线程流程分析
2.4 线程开销测试
2.5 本章小结
第三章 并行模拟器上的线程轻化研究
3.1 并行模拟器概述
3.2 问题分析及解决尝试
3.2.1 问题分析
3.2.2 相应的优化尝试
3.3 轻线程调度框架
3.4 改进测试与评估
3.5 本章小结
第四章 线程轻化在服务器访问模型上的扩展研究
4.1 Web 服务器概述
4.1.1 Web 服务器简介
4.1.2 Web 服务器的工作原理
4.1.3 Web 测试工具及性能指标
4.1.4 Web 服务器现状与主要问题
4.2 Web 服务器访问模型介绍
4.2.1 SpecWe699 概览
4.2.2 Web 服务器模型介绍
4.3 轻线程调度框架的应用
4.4 测试评估
4.5 本章小结
第五章 高性能应用线程轻化研究
5.1 线程轻化不适合HPL
5.1.1 HPL 简介
5.1.2 HPL 主要流程
5.1.3 HPL 仿真模型及验证
5.1.4 各部分开销参照
5.2 以NPB 为例的其他高性能应用分析
5.3 本章小结
第六章 总结与展望
6.1 线程轻化小结
6.2 本文工作总结
6.3 问题与下一步研究工作
附录A Linux 进程简介
A.1 Linux 进程状态说明
A.2 do_fork 具体流程及源码分析
A.3 schedule 具体流程及源码分析
附录B Pthread 简介
附录C 精确计时程序
参考文献
致谢
作者简历
发布时间: 2006-12-26
参考文献
- [1].基于SMP集群的性能优化方法的研究[D]. 魏伟.兰州大学2006
- [2].基于SMP机群的层次化编程模型的设计及实现[D]. 张丹丹.曲阜师范大学2013
- [3].基于SMP机群的虚拟共享存储系统[D]. 刘海明.中国科学院研究生院(计算技术研究所)2001
- [4].基于SMP的离散事件执行驱动性能模拟器设计与实现[D]. 张新.国防科学技术大学2012
- [5].基于SMP机群的并行编程模型的研究应用与优化[D]. 李桂君.曲阜师范大学2014
- [6].面向多核SMP集群的并行性能模拟技术研究[D]. 翁玉芬.国防科学技术大学2009
- [7].面向SMP的模板计算访存优化研究[D]. 董钰山.国防科学技术大学2015
- [8].虚拟化SMP架构下服务器性能优化[D]. 王强.华中科技大学2011
- [9].多处理器系统中的线程调度研究[D]. 范光雄.电子科技大学2010
- [10].基于x86处理器的高可用SMP服务器的设计与实现[D]. 胡远明.中国科学院大学(中国科学院工程管理与信息技术学院)2017
相关论文
- [1].基于X86体系结构VxWorks SMP调度和中断机制研究与优化[D]. 王迪.国防科学技术大学2009
- [2].基于SMP架构的半虚拟化CPU调度算法研究[D]. 郑兴杰.哈尔滨工程大学2009
- [3].基于多核系统的线程调度[D]. 覃中.电子科技大学2009
- [4].基于SMP机群的虚拟共享存储系统[D]. 刘海明.中国科学院研究生院(计算技术研究所)2001
- [5].基于SMP节点机群系统上MPI与OpenMP并行程序设计的研究[D]. 张志宏.内蒙古大学2007
- [6].Linux内核支持SMP并行机制的分析[D]. 潘华.四川大学2005
- [7].基于SMP集群的性能优化方法的研究[D]. 魏伟.兰州大学2006
- [8].基于多核处理器的实时操作系统的扩展[D]. 章承科.电子科技大学2006
- [9].面向多处理器结构的嵌入式Linux系统研究与实现[D]. 邓竹莎.电子科技大学2006
- [10].SMP环境下的多机互联的研究[D]. 万国平.西北工业大学2004