您的位置:首页 > 大数据

深入解析大数据虚拟化的架构(上)- 部署架构

2013-08-09 11:22 603 查看
继《零起点部署大数据虚拟化》系列教程之后,本着“知其然,亦知其所以然”的原则,本系列走进大数据虚拟化的内部,分上下两篇博文,帮助读者了解vSphere Big Data Extensions(以下简称BDE)的部署架构和系统架构,理解部署原理和内部构成,以及各自的作用。希望对您有所帮助,也欢迎您留言评价。

上: Serengeti虚拟化应用(即本文)

下: Serengeti管理服务器的系统架构


Serengeti虚拟化应用
vSphere Big Data Extensions (BDE)是VMware基于 Serengeti开源技术的企业发行版。其重点是增强vSphere基础架构对Serengeti的支持,更好地部署、运行和管理大数据相关负载。
从部署角度看,BDE打包了Serengeti虚拟化应用,并且包括一个vCenter网页客户端的插件。
Serengeti虚拟化应用(VirtualAppliance)包括Serengeti管理服务器和虚拟机模板。这个应用可以很容易地部署在VMware的vCenter之上。



大数据虚拟化(BDE/Serengeti)的部署结构图

Serengeti管理服务器是整个Serengeti的核心部件,提供Hadoop集群在虚拟化环境下的部署,管理的功能。并且为不同用户提供不同的资源使用策略。
对资源利用率要求高的客户,可以在Serengeti的帮助下,使资源在hadoop应用和其他应用之间有效的共享。而对于Hadoop的performance有更高要求的客户,则可以通过Serengeti实现资源在不同应用之间完美隔离,达到在资源独占情况下的最优使用效果。
Serengeti管理服务器对外提供RESTAPI,以便远程客户端访问和控制hadoop集群。SerengetiCLI和BDE的UI 插件都是通过RESTAPI访问Serengeti管理服务器的。
Hadoop 集群的所有虚拟机都是从Serengeti虚拟机模板直接或间接复制而来,其中包括一个基本的CentOS操作系统,简单的集群安装需要的软件。但是其中不包含Hadoop的安装包,是因为Serengeti可以支持多种Hadoop发行版,这些软件的安装是在集群的创建过程中完成的。
部署完成之后,Serengeti管理服务器作为一个虚拟化应用运行在某一台虚拟主机中。并且注册成为vCenter的一个扩展服务器。之后,Serengeti会和vCenter建立SSL链接,确保数据交互的安全性和可靠性。

未完待续... 之后会讨论下篇 - vSphere Big Data Extensions/Serengeti的系统架构,敬请期待!

如有任何问题,您可以发邮件至bigdata_apac@vmware.com

关于vSphereBig Data Extensions:
VMware vSphere Big Data Extensions(简称BDE)基于vSphere平台支持大数据Hadoop作业。BDE以开源Serengeti项目为基础,为企业级用户提供一系列整合的管理工具,通过在vSphere上虚拟化Hadoop,帮助用户在基础设施上实现灵活、弹性、安全和快捷的大数据部署、运行和管理工作。了解更多关于VMware vSphere Big Data Extensions的信息,请参见http://www.vmware.com/hadoop

作者简介



蔺永华 (Emma Lin)
VMware高级开发工程师,Staff Engineer
担任VMware大数据产品vSphere BDE、Serengeti开源项目的技术带头人,引领和参与Serengeti核心架构与功能的设计和研发,经历Serengeti自问世以来的6个版本的研发和发布。长期致力于通过vSphere BDE/Serengeti使VMware虚拟化基础架构成为大数据应用的最好选择。在VMware之前,就职于BEA/Oracle软件开发中心,长期从事分布式系统的开发、设计工作,拥有丰富的企业软件开发经验。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  虚拟化 架构 大数据