您的位置：首页 > 运维架构 > Linux

大数据技术的事件处理上应该如何选择Linux服务器？

2015-11-07 20:44 627 查看

大数据技术的事件处理上应该如何选择Linux服务器？

大数据技术的事件处理，在系统资源使用上，需要很强的计算能力，如何选择Linux服务器？

希望获得：通用方法

关注问题7

回答8

评论

8 回答

loveryue
软件开发工程师 , IBM

晓黎
赞同了此回答

正如您所说，确实要根据场景来判断。
目前整体来看，大数据无论采用MR或者Spark，都牵扯到了，大量的迭代计算和suffling，对CPU有很高的要求。所以，从硬件选型来看，首先，CPU的计算能力最为重要，这也是为什么Power8 的Linux的服务器在MR或者SPARK上有很好的表现。
其次，对于批处理方面的计算，可以把CPU的多线程的特征关闭，以减少CPU调度上的开销。
还有，就是考虑CPU到cahce，CPU到内存，CPU到IO的内部带宽通道，这好比高速公路，路越宽，通行能力越强。
最后，IO还是要考虑的，MR的suffing落盘，Spark的可落可不落，所以多个磁盘驱动器也很重要。
所以，Power8的linux服务器是大数据的领先服务器。

1
天前

赞同1

评论

humidy
信息分析/架构师 , 某公司

xijiehaiqing
赞同了此回答

作为一个Hadoop管理员或架构师，集群实现的实战部分从决定需要使用哪一种硬件，以及需要的硬件数量开始。但是在这之前有一些必要的问题需要得到解答。这些问题中有集群设计相关的，像集群需要存储多少的数据，数据的增长率是多少，主要的数据访问模式是什么，集群是不是用于预定的任务调度，是不是一个用于数据分析探索的多用户环境？

同时，一些集群为了更好的用于专门的特定工作，需要在硬件方面专门的考虑一些因数。当规划使用数百台服务器的时候，关于硬件的初始决定和总体布局将会极大的影响集群的性能、稳定性和相关费用。
问模式是什么，集群是不是用于预定的任务调度，是不是一个用于数据分析探索的多用户环境？
总所周知，组成Hadoop集群的服务器有很多种类型。比如主控节点，如NameNode，Secondary NameNode和JobTracker；工作节点被称为DataNodes；除了核心的Hadoop组件服务器，通常我们会部署一些辅助服务器，如网关(Gateways)、Hue服务器以及Hive元服务器。

因为这些类型的服务器在集群中的角色不同，所以对于硬件规格和可靠性的要求也不同。接下来我们会讨论DataNode、NameNode、Jobtracker不同节点的不同硬件需求和选择。
辅助服务器，如网关(Gateways)、Hue服务器以及Hive元服务器。

1
天前

赞同1

评论

zv8912000
系统架构师 , 电信行业

事件处理要看需求应用场景，
如果应用场景并发较多，计算少，则需要采用高内存，如计算用户的最后的浏览页面；
如果应用场景并发少，但计算复杂，则需要采用高CPU。如计算用户的访问页面有哪些偏好

1
天前

赞同

评论

月光无寒
系统工程师 , 新疆电信

首先，如果纯存储型的，配置可以不高。如果带计算的，也相应配合提升cpu。如果是spark.起步内存建议还是128G。存储部分，可以考虑增加几块ssd。关键还是看应用和资金，有钱的话适当超前一点，运行也能稳定不少。

答案包含：具体解决, 原理分析 • 1
天前

赞同

评论

xuyanhui
信息分析/架构师 , 58同城大数据

目前来说，传统的互联网公司，硬件配置，主要是4*12的SATA盘，196G内存，32Core的服务器，结合各种应用场景不同，硬件配置也会不一样，既要考虑服务器的性价比，又要兼容各种业务需求，

1
天前

赞同

评论

zv8912000
系统架构师 , 电信行业

hadoop的宗旨虽然是蚂蚁吃大象，但不是说要把老虎和狼拆成蚂蚁的大小再吃大象。这个单机性价比对应业务性能需要通过实际测试才能得出。一般来说，2.2主频和2.6主频在实际业务场景可能但进城差一半效果，所以提升主频不乏也是优秀考虑之一。

1
天前

赞同

评论

zv8912000
系统架构师 , 电信行业

实际业务测试，会发现高主频才会带来海量数据的性价比。CPU配比内存槽位，最终硬盘个数相关。
同时，hadoop在硬盘上追求的不是大容量，而是适当，一个2TSATA盘，如果坏了，需要6个小时同步，这样集群大了总会有坏硬盘，就会导致系统常年在恢复数据与缓慢运行间挣扎。所以高CPU，多磁盘，把节点配满才是最佳选择。

1
天前

赞同

评论

wang_feng
软件架构设计师 , 威海市商业银行

linux服务器部署的集群，是不是要考虑一下数据的增长量，一般PC server的更换年限是3到5年，如果数据量增长不是特别快，计算量也不是特别大，在服务器选择方面考虑稳定性是优先选择。

答案包含：注意事项 • 1
天前

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航