您的位置:首页 > 其它

开源文化

2021-03-16 22:25 13 查看

软件开发领域,开源源远流长,大数据更是一出生便和开源紧密结合在一起。从Google公布几篇论文开始,Doug Cutting受启发发明Hadoop之后,就以开源的形式公布。大数据技术和开源为什么联系得如此紧密,笔者认为有两个主要原因:

(1)大数据是基础设施,基础设施如OS,不是简单的一个公司或者个人就可以完全负责开发和维护的,所以通过开源协助降低开发成本是更好的选择。

(2)基础设施技术先进是一方面,另一方面则是需要应用的支持。所以通过开源构建生态,吸引应用的共同发展,也是促进大数据技术和开源紧密联系的驱动力之一。

讲到开源,肯定要讲到GitHub。Git是一个分布式的版本控制系统,最初由Linus Torvalds编写,用作Linux内核代码的管理。在推出后,Git在其他项目中也取得了很大成功,尤其是在Ruby社区中。目前,包括Rubinius、Merb和Bitcoin在内的很多知名项目都使用了Git。Git同样可以被诸如Capistrano和Vlad the Deployer这样的部署工具所使用。

GitHub提供Web界面,采用社区运作,托管各种Git库。作为开源代码库及版本控制系统,GitHub目前拥有140多万开发者用户。随着越来越多的应用程序转移到云上,Github已经成为管理软件开发及发现已有代码的首选方法。

GitHub的价值不在于一个版本控制网站,更大的意义在于让社会化编程成为现实,可以认为是程序员的社交网站。

开源意味着更多的人参与进来,对个人和公司拥有更多的选择。但是更多的选择不代表更多的自由;更多的选择导致决策的延迟和满意度的降低;快乐之秘诀在于降低自己的期望值。

本文选自《大数据架构详解:从数据获取到深度学习》12.1节。

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: