您的位置:首页 > 大数据 > 云计算

老李分享云计算基本概念 2

2016-01-26 17:18 357 查看
2、分布式文件系统:

HDFS,GFS等:适合存储大文件。(HDFS对大文件做了优化,关注吞吐量,适合做批处理)

MogileFS,FastDFS,OpenStack的Swift等。适合存储小文件

淘宝的TFS。

注解1 -- 下面是转载来的HDFS和Swift的对比:

最近在Quora上有人提到一个问题,有关Hadoop分布式文件系统和OpenStack对象存储的不同。问题原文如下:

“Hadoop分布式文件系统(HDFS)和OpenStack对象存储(OpenStack Object Storage)似乎都有着相似的目的:实现冗余、快速、联网的存储。什么样的技术特性让这两种系统因而不一样?这两种存储系统最终趋于融合是否大有意义?”

问题提出之后,很快有OpenStack的开发者进行了回复。51CTO在此摘抄了前两名回复进行翻译,以供各位参考。

排名第一的答案来自RackSpace的OpenStack Swift开发者Chuck Their:

虽然HDFS与Openstack对象存储(Swift)之间有着一些相似之处,但是这两种系统的总体设计却大不一样。

1. HDFS使用了中央系统来维护文件元数据(Namenode,名称节点),而在Swift中,元数据呈分布式,跨集群复制。使用一种中央元数据系统对HDFS来说无异于单一故障点,因而扩展到规模非常大的环境显得更困难。

2. Swift在设计时考虑到了多租户架构,而HDFS没有多租户架构这个概念。

3. HDFS针对更庞大的文件作了优化(这是处理数据时通常会出现的情况),Swift被设计成了可以存储任何大小的文件。

4. 在HDFS中,文件写入一次,而且每次只能有一个文件写入;而在Swift中,文件可以写入多次;在并发操作环境下,以最近一次操作为准。

5. HDFS用Java来编写,而Swift用Python来编写。

另外,HDFS被设计成了可以存储数量中等的大文件,以支持数据处理,而Swift被设计成了一种比较通用的存储解决方案,能够可靠地存储数量非常多的大小不一的文件

注解2 -- 下面是转载来的FastDFS和HDFS的对比:
主要是定位和应用场合不一样。
hadoop的文件系统HDFS主要解决并行计算中分布式存储数据的问题。其单个数据文件通常很大,采用了分块(切分)存储的方式;
FastDFS主要用于大中网站,为文件上传和下载提供在线服务。所以在负载均衡、动态扩容等方面都支持得比较好,FastDFS不会对文件进行分快(切分)存储。

一句话概括就是:HDFS是给超大的数据集设计的, FASTDFS是专为小文件设计的,FASTDFS有JAVA 的API

注解3: --- 下面是转载来的流行的分布式系统的常见应用场景:

应用场景

可行系统

大数据离线/在线分析

HDFS、Swift、GlusterFS

电子商务

TFS、FastDFS、Dynamo、Swift、Tair

社交网络

TFS、FastDFS、Dynamo、Swift、Tair

网络硬盘

HDFS、FastDFS、Swift、GlusterFS

邮件服务

TFS、FastDFS、Dynamo、Swift、Tair

图片服务

TFS、FastDFS、Dynamo、Swift、Tair

语音视频服务

HDFS、FastDFS、Swift、GlusterFS

虚拟机调度和镜像存储

HDFS、Swift、GlusterFS

3、云计算平台/解决方案(提供IaaS)

CouldStack: Apache的

OpenStack: Rackspace 和 NASA 共同开发的,帮助服务商和企业内部实现类似于 Amazon EC2 和 S3 的云基础架构服务(Infrastructure as a Service, IaaS)

vCloud Director: VMware开发的用于部署云的平台
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: