【大数据】R语言的速成与实战
【R语言基础知识】:
R:是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。
关于R的一个比较准确的描述是:R是一门用于统计计算和作图的语言,它不单是一门语言,更是一个数据计算与分析的环境。统计计算领域有三大工具:SAS、SPSS、S,R正是受S语言和Scheme语言影响发展而来。R语言语法通俗易懂,很容易学会和掌握语言的语法。而且学会之后,我们可以编制自己的函数来扩展现有的语言。这也就是为什么它的更新速度比一般统计软件,如SPSS、SAS等快得多。大多数最新的统计方法和技术都可以在R中直接得到。
作为当前在世界范围内最受欢迎的数据挖掘开发语言——R语言以其特有的开放性、高可扩展性以及顶尖的制图功能吸引了越来越多的数据分析爱好者。
【R语言的主要特点】:
R作为一种统计分析软件,是集统计分析与图形显示于一体的。它可以运行于UNIX,Windows和Macintosh的操作系统上,而且嵌入了一个非常方便实用的帮助系统,相比于其他统计分析软件,R还有以下特点:
1.R是自由软件。这意味着它是完全免费,开放源代码的。可以在它的网站及其镜像中下载任何有关的安装程序、源代码、程序包及其源代码、文档资料。标准的安装文件身自身就带有许多模块和内嵌统计函数,安装好后可以直接实现许多常用的统计功能。
2.R是一种可编程的语言。作为一个开放的统计编程环境,语法通俗易懂,很容易学会和掌握语言的语法。而且学会之后,我们可以编制自己的函数来扩展现有的语言。这也就是为什么它的更新速度比一般统计软件,如,SPSS,SAS等快得多。大多数最新的统计方法和技术都可以在R中直接得到。
3. 所有R的函数和数据集是保存在程序包里面的。只有当一个包被载入时,它的内容才可以被访问。一些常用、基本的程序包已经被收入了标准安装文件中,随着新的统计分析方法的出现,标准安装文件中所包含的程序包也随着版本的更新而不断变化。在另外版安装文件中,已经包含的程序包有:base一R的基础模块、mle一极大似然估计模块、ts一时间序列分析模块、mva一多元统计分析模块、survival一生存分析模块等等.
4.R具有很强的互动性。除了图形输出是在另外的窗口处,它的输入输出窗口都是在同一个窗口进行的,输入语法中如果出现错误会马上在窗口口中得到提示,对以前输入过的命令有记忆功能,可以随时再现、编辑修改以满足用户的需要。输出的图形可以直接保存为JPG,BMP,PNG等图片格式,还可以直接保存为PDF文件。另外,和其他编程语言和数据库之间有很好的接口。
5.如果加入R的帮助邮件列表一,每天都可能会收到几十份关于R的邮件资讯。可以和全球一流的统计计算方面的专家讨论各种问题,可以说是全世界最大、最前沿的统计学家思维的聚集地.
R是基于S语言的一个GNU项目,所以也可以当作S语言的一种实现,通常用S语言编写的代码都可以不作修改的在R环境下运行。 R的语法是来自Scheme。R的使用与S-PLUS有很多类似之处,这两种语言有一定的兼容性。S-PLUS的使用手册,只要稍加修改就可作为R的使用手册。所以有人说:R,是S-PLUS的一个“克隆”。但是请不要忘了:R是免费的(R is free)。R语言源代码托管在github,具体地址可以看参考资料。 。
R语言的下载可以通过CRAN的镜像来查找。
R语言有域名为.cn的下载地址,有六个,其中两个由Datagurn,由中国科学技术大学提供的。R语言Windows版,其中由两个下载地点是Datagurn和USTC提供的。
总的来说:R语言的优劣势已经很明显 !
R语言的优势是免费开源易操作,劣势是慢、慢、慢!
小编推荐R语言入门实战课程:大数据之R语言速成与实战
(课程可以帮助大家掌握R语言的使用以及实际的操作案例适合大数据学习者、开发者学习)
更多精品技术课程:
阿里云大学官网(阿里云大学 - 官方网站,云生态下的创新人才工场)
- 【大数据】R语言速成与实战
- 大数据之R语言速成与实战,送给数据分析爱好者
- 大数据之R语言速成与实战,免费送给数据分析爱好者
- 大数据之R语言速成与实战!
- R语言数据抓取实战——RCurl+XML组合与XPath解析
- 大数据Spark “蘑菇云”行动Hadoop实战速成之路第29课:Hadoop架构详解及Hadoop集群搭建、配置和测试实战
- 慕课R语言之数据可视化学习笔记——3.3基本绘图系统实战
- 零基础数据分析与挖掘R语言实战课程(R语言)
- [置顶] 【R语言 数据探索】实战 Diamonds数据集探索
- 零基础数据分析与挖掘R语言实战课程(R语言)
- 大数据全栈高手速成Spark2.0精讲(全场景项目实战)
- R语言爬虫实战:知乎live课程数据爬取实战
- R语言数据挖掘实战系列(2)
- 数据Spark “蘑菇云”行动Hadoop实战速成之路第30课:Hadoop在Eclipse下的编程实战
- 第90讲,Spark streaming基于kafka 以Receiver方式获取数据 原理和案例实战
- 【Web API系列教程】3.4 — 实战:处理数据(处理实体关系)
- 【数据分析 R语言实战】学习笔记 第六章 参数估计与R实现(下)
- 云星数据---Scala实战系列(精品版)】:Scala入门教程056-Scala实战源码-Scala IO 读写
- R语言的数据转换: split – apply – combine 模式
- 2017.2.21 activiti实战--第十三章--流量数据查询与跟踪(一)查询接口介绍及运行时数据查询