从事大数据开发,主要会运用到哪几种语言?
大数据的的开发会运用到很多语言,那么下面我们来看一下这几种语言的具体运用
Python:
十多年来,Python在学术界当中一直很流行,尤其是在自然语言处理(NLP)等领域。因而,如果你有一个需要NLP处理的项目,就会面临数量多得让人眼花缭乱的选择,包括经典的NTLK、使用GenSim的主题建模,或者超快、准确的spaCy。同样,说到神经网络,Python同样游刃有余,有Theano和Tensorflow;随后还有面向机器学习的scikit-learn,以及面向数据分析的NumPy和Pandas。
还有Juypter/iPython――这种基于Web的笔记本服务器框架让你可以使用一种可共享的日志格式,将代码、图形以及几乎任何对象混合起来。这一直是Python的杀手级功能之一,不过这年头,这个概念证明大有用途,以至于出现在了奉行读取-读取-输出-循环(REPL)概念的几乎所有语言上,包括Scala。
Python是一种传统的面向对象语言,所以大多数开发人员用起来会相当得心应手,而初次接触R或Scala会让人心生畏惧。一个小问题就是你的代码中需要留出正确的空白处。这将人员分成两大阵营,一派觉得“这非常有助于确保可读性”,另一派则认为,我们应该不需要就因为一行代码有个字符不在适当的位置,就要迫使解释器让程序运行起来。
JAVA:
Java,以及基于Java的框架,被发现俨然成为了硅谷最大的那些高科技公司的骨骼支架。“如果你去看Twitter,LinkedIn和Facebook,那么你会发现,Java是它们所有数据工程基础设施的基础语言,”Driscoll说。
Java不能提供Python同样质量的可视化,并且它并非统计建模的最佳选择。但是,如果你移动到过去的原型制作并需要建立大型系统,那么Java往往是你的最佳选择。
Hadoop和Hive:
一群基于Java的工具被开发出来以满足数据处理的巨大需求。Hadoop作为首选的基于Java的框架用于批处理数据已经点燃了大家的热情。Hadoop比其他一些处理工具慢,但它出奇的准确,因此被广泛用于后端分析。它和Hive一个基于查询并且运行在顶部的框架可以很好地结对工作。
人工智能、大数据、云计算和物联网的未来发展值得重视,均为前沿产业,多智时代专注于人工智能和大数据的入门和科谱,在此为你推荐几篇优质好文:
送给大数据开发初学者的良言,有兴趣的可以看看
http://www.duozhishidai.com/article-7742-1.html
在人工智能和大数据的开发过程中,有哪些特别需要注意的要点?
http://www.duozhishidai.com/article-2052-1.html
对于大数据开发的学习,最经典的学习路线是什么?
http://www.duozhishidai.com/article-1544-1.html
多智时代-人工智能和大数据学习入门网站|人工智能、大数据、物联网、云计算的学习交流网站
- [置顶] 运用ArcGIS Server开发WebGIS系统主要几种途径及发展趋势
- 大数据处理需要用到的编程语言开发语言
- 数据绑定101-----主要看一下表达式语言
- HealthKit开发教程之HealthKit的主要类型数据
- 为什么说Python 是大数据全栈式开发语言
- 大数据可视化应用工具,主要有哪几种?
- 论SOA架构的几种主要开发方式
- 论SOA架构的几种主要开发方式【转】
- SQLServer存储多语言数据的几种方法
- 【Android 开发】 : Activity之间传递数据的几种方式
- iOS开发中几种刷新数据的方法
- c语言基础与提高(一)数据类型,混合运算,运算符,以及几种基本判断,循环语句
- C、C++、Java、JavaScript、PHP、Python、Ruby 这些语言分别主要用来开发什么?
- HealthKit开发教程之HealthKit的主要类型数据
- RabbitMQ的几种典型使用场景-java语言开发
- 5.MVC框架开发(强类型开发,控制器向界面传递数据的几种方法)
- 几种语言原生开发环境构建之--Typescript语言
- SharedPreferences类供开发人员保存和获取基本数据类型的键值对.该类主要用于基本类型, 例如boolean,float.int,long和string. SharedPr
- 几种语言原生开发环境构建之--Go语言
- 论SOA架构的几种主要开发方式