数据中心Hadoop部署与追踪系统研究

数据中心Hadoop部署与追踪系统研究

论文摘要

MapReduce框架和其开源实现Hadoop自从问世以来,受到了学术界和工业界的广泛关注和使用。但是开发一个高效的MapReduce应用通常需要大量的MapReduce集群使用经验甚至需要理解MapReduce模型的底层工作机理。另外,快速建立一个可用的MapReduce集群环境也是用户比较关心的一个话题。因此,快速部署MapReduce集群环境、并实时展示MapReduce的工作流程是更好理解、应用甚至完善MapReduce模型过程中必须要研究的重要课题。Hadoop部署与追踪系统HDTS(Hadoop Deploy and Tracing System),旨在提供先部署MapReduce集群环境然后对MapReduce作业进行追踪的一体化解决方案。其中部署子系统提供了一种不需要用户接触机器便能快速部署、配置Hadoop集群环境的一种解决方案;而追踪子系统提供了一种在Hadoop集群环境部署成功后,实时展示MapReduce工作流程的解决方案。部署子系统向用户提供友好的用户界面,使用户在几个步骤之内轻松完成大规模Hadoop集群的配置、分发、启动等工作;追踪子系统基于对Hadoop源码工程的深刻理解,通过在源码中插入追踪代码,使得用户可以在追踪客户端直观感受、并且参与到MapReduce作业的运行。追踪子系统通过一种观察点的机制来保证追踪子系统实时地、精确地向用户提供追踪信息。追踪子系统使用自己修改过的追踪内核,用户在装配了这个新的内核之后,其所有接下来的操作与平时操作无异,多个用户能在任何装有追踪子系统客户端的节点上同时开启追踪客户端。因此,HDTS系统让用户在不接触物理机器的前提下,完成了对Hadoop集群的部署和追踪,为用户提供了完善的功能和良好的使用体验。Hadoop部署子系统前端采用Ext Ajax Framework,后端使用Python CGI管理Linux机器;Hadoop追踪子系统基于Hadoop源码工程,采用Java语言作为追踪代码实现和客户端实现。功能测试表明,部署子系统正确完成了Hadoop的配置、分发、启动工作;追踪子系统正确完成了各个观察点的展示。性能测试表明,追踪子系统对系统造成时间开销不超过4%。

论文目录

  • 摘要
  • ABSTRACT
  • 1 绪论
  • 1.1 研究背景和问题提出
  • 1.2 国内外研究现状
  • 1.3 课题来源与研究内容
  • 1.4 文章框架结构
  • 2 数据中心HADOOP 部署与追踪系统 HDTS 设计
  • 2.1 HDTS 系统概述
  • 2.2 MAPREDUCE 和HDFS 的体系结构
  • 2.3 HADOOP 工作流程分析
  • 2.4 HDTS 系统的体系结构
  • 2.5 HDTS 系统的功能模块
  • 2.6 HDTS 系统的工作机制与处理流程
  • 2.7 HDTS 系统追踪信息拥塞控制算法
  • 2.8 小结
  • 3 HDTS 系统的主要实现技术
  • 3.1 基于JSON 和SSH 互信的通信
  • 3.2 基于状态保持的服务器空间管理
  • 3.3 基于HDFS 视角的追踪
  • 3.4 基于MAPREDUCE 任务调度视角的追踪
  • 3.5 小结
  • 4 系统测试与性能分析
  • 4.1 测试环境
  • 4.2 功能测试
  • 4.3 性能测试和分析
  • 4.4 小结
  • 5 总结及展望
  • 致谢
  • 参考文献
  • 附录1 攻读学位期间发表的论文
  • 附录2 攻读学位期间申请的国家发明专利目录
  • 附录3 攻读硕士学位期间参加的主要科研项目
  • 相关论文文献

    • [1].我国开放政府数据政策协同机理研究[J]. 情报科学 2020(05)
    • [2].加权有向图社区发现的子系统划分[J]. 控制理论与应用 2020(09)
    • [3].检港查验系统“废物原料”子系统的设计与实现[J]. 价值工程 2017(29)
    • [4].基于通信列车控制的计算机城市轨道交通联锁子系统功能测试研究[J]. 自动化技术与应用 2020(03)
    • [5].综合能源系统中热力子系统的稳态特性分析[J]. 发电技术 2020(03)
    • [6].旅游地社会-生态子系统恢复力比较分析——以浙江省淳安县为例[J]. 旅游学刊 2016(02)
    • [7].略论科技进步与政策子系统不公[J]. 山东行政学院山东省经济管理干部学院学报 2009(05)
    • [8].一种基于层次聚类的子系统划分方法研究[J]. 计算机科学 2015(12)
    • [9].计算语义学中的语言子系统理论[J]. 解放军外国语学院学报 2014(03)
    • [10].行政财务系统报销子系统的设计与实施[J]. 自动化与仪器仪表 2016(11)
    • [11].城市社区子系统的问题及协商治理建设服务型社区的对策[J]. 法制博览 2016(06)
    • [12].一种通用自动测试系统自检子系统的设计与实现[J]. 测控技术 2015(07)
    • [13].专用设备制造业创新驱动系统的协同度研究[J]. 中国科技论坛 2015(08)
    • [14].巧治顽呃(下)[J]. 家庭中医药 2011(03)
    • [15].高校报宣传子系统的控制与作用[J]. 山东省农业管理干部学院学报 2013(02)
    • [16].浅谈编目子系统设置[J]. 东方企业文化 2012(10)
    • [17].我国现代化系统中科技子系统结构要素研究[J]. 商场现代化 2009(02)
    • [18].HMIS运用子系统常见问题与处理[J]. 上海铁道科技 2008(04)
    • [19].粤港澳大湾区“菜篮子”信息平台物流子系统的研究[J]. 信息技术与信息化 2020(08)
    • [20].基于系统动力学的企业安全经济效益分析—以安全教育经济效益子系统为例[J]. 中国安全生产科学技术 2015(12)
    • [21].列车运行状态监测地面子系统的研制[J]. 黑龙江科技信息 2011(27)
    • [22].广义子系统的非线性控制及其在电力系统分散控制中的应用[J]. 自动化技术与应用 2008(08)
    • [23].中国亟需一场深刻的观念变革[J]. 党政视野 2016(10)
    • [24].铁路牵引供电远动系统维护子系统的设计与实现探析[J]. 黑龙江科技信息 2012(29)
    • [25].基于粒子系统的煤矿透水子系统的设计与实现[J]. 长春工业大学学报(自然科学版) 2011(01)
    • [26].IP多媒体子系统(IP Multimedia Subsystem IMS)[J]. 西安邮电学院学报 2010(03)
    • [27].安防录像子系统的设计与实现[J]. 数字技术与应用 2010(05)
    • [28].基于复杂网络社团结构的恢复子系统划分算法[J]. 电力系统自动化 2009(12)
    • [29].城市交通子系统划分初探——以成都市为例[J]. 城市公共交通 2009(09)
    • [30].卫星数传通道子系统中开关矩阵的选用分析[J]. 信息通信 2017(04)

    标签:;  ;  ;  ;  

    数据中心Hadoop部署与追踪系统研究
    下载Doc文档

    猜你喜欢