您的位置:首页 > 编程语言 > Python开发

在天河二号上对比Julia,Python和R语言

2017-03-22 18:54 477 查看
Julia是一款高级高效为技术计算(technical computing)而设计的编程语言,其语法与其他计算环境类似。其为分布式计算和并行所设计,最知名的地方在于其接近C语言的高效率。

按开发者的话说,“我们希望这门开源语言像C一样快…像Python一样通用,像R做统计那么简单,像Perl做文本处理那么方便,像Matlab的线性代数一样强大,还和Shell一样可以把各种程序连接起来”。

打开Julia的首页http://julialang.org/,在一长串特性介绍后面,便是和各种语言的对比测试。



测试以C为标准,从结果上来看Julia的性能比Python高一个数量级,而比R语言高一到两个数量级。是否真的如此呢,笔者进行了简单测试。

测试使用Julia官方提供的测试程序,使用炼数成金提供的天河二号资源,使用1节点1核心计算(Intel(R) Xeon(R) CPU E5-4640 0 @ 2.40GHz),Julia = 4.5,Python = 2.7.9/3.5.2,R = 3.3.2

测试过程

1, 首先下载官方标准测试程序https://github.com/JuliaLang/julia/tree/master/test/perf

2, 这里测试micro-benchmark,阅读代码可知这里测试了7个项目:

"fib" = "Recursive fibonacci"

"parse_int" = "Integer parsing"

"quicksort" = "Sorting of random numbers using quicksort"

"mandel" = "Calculation of mandelbrot set"

"pi_sum" = "Summation of a power series"

"rand_mat_stat" = "Statistics on a random matrix"

"rand_mat_mul" = "Multiplication of random matrices"

可以看出这里测试了许多常见的场景如调用函数,解析string,排序,循环,随机数生成,向量操作等。代码如图。



3, 登陆天河二号进行测试

使用Xshell连接天河,并查看天河已经部署的Julia



可查看天河CPU信息



运行Julia提供的测试,结果如下:



结果整理如下,附上官方benchmark



可以看出Julia果然快得不可思议,转换成以Julia为标准的形式观察:



基本和官方数据一致,Julia 0.4.5甚至更快,稳定地比Python快一个数量级,而R语言则在计算斐波拉契和快排时落后两个数量级。这体现了Julia开发比C简单效率接近于C地特性。作者还贴心的比较了实现randmatstat的Julia和C的代码量,这里截图并横向显示(右上角为Julia代码量)。

总结,尽管Julia在国内并不算特别火热,但作为面向高性能计算语言,其高效易用的特点值得我们的关注。通过语言本身的设计,Julia从底层的循环到高级的编程风格应用,仅牺牲少量的性能就可以用简单的方式实现复杂的算法。



引用:

1. Julia主页 http://julialang.org/
2. Julia中文社区http://julialang.cn/

3. Julia语言:让高性能科学计算人人可http://www.csdn.net/article/2014-03-12/2818732

最后放上一张各语言官方benchmark对比图 http://julialang.org/benchmarks/




《大数据必知的java基础》立足于Java语言本身及Java技术开发。会涉及并贯穿有关学习大数据系统和软件必知的一些预备知识。点击下方二维码报名课程
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: