工作手记(二)R语言的data.table框架的学习,以及日常处理数据算法基本流程
2019-03-12 12:34
295 查看
R语言中的data.table框架
可能是我对pandas和numpy的组合不太熟悉,但是R语言对于表格数据的处理有相应的格式,封装的很好,data.table基本上是从data[i,j,by=‘ ’] :在满足i子集的条件下,通过by的分组,对列j进行处理。
但是,格式的固定,并没有限制处理情况的多样化:
diandongbang_fix2[,temp:={ temp2=unique(unlist(tstrsplit(temp,''))) temp2=temp2[!temp2 %in% c(' ','(',')')] temp2=paste0(temp2,collapse='|') temp2 },by=.(id)]
在使用data.table框架时,编写函数不可以使用if语句,因为传进来的是一个boolean型的向量,放在一个if()里面进行判断,是不可运行的。
若是对一张表有if操作,可以多写几个语句,使用data[ ]中的第一个参数进行子集筛选,进行操作。
另外,对于目前自己来说,所做的一些事情,及本所需要的罗列在下面几点:
-
使用接口来获取数据,getfromSQL94_where[database,table,where_suffix=" "]
-
使用merge()函数来对所获取的数据进行连接
merge(data1,data2,by.x= ,by.y= [,all.x=T])
all,all.x,all.y:指定x和y的行是否应该全在输出文件.即实现左连接,右连接,内连接,外连接等操作。 -
setnames( c( ),c( ) )对相应列名操作,并更换列名。
-
最后 write.csv( )即可。
相关文章推荐
- Scrapy框架的学习(1.scrapy的概念以及scrapy的工作流程)
- 用python 实现数据反序列化处理 以及 算法的学习
- HP data protector软件学习1--基本角色与基本工作流程
- 数据处理的两个基本问题01 - 零基础入门学习汇编语言38
- 数据处理的两个基本问题05 - 零基础入门学习汇编语言42
- YARN基本框架和工作流程
- 数据处理的两个基本问题03 - 零基础入门学习汇编语言40
- 【Spring学习笔记-MVC-5】利用spring MVC框架,实现ajax异步请求以及json数据的返回
- R语言学习第五天----数据读取以及数据保存
- 汤晓鸥谈深度学习三大核心要素:算法设计、高性能的计算能力以及大数据
- 数据处理的两个基本问题05 - 零基础入门学习汇编语言42
- Linux icmp 学习笔记 之二 icmp数据处理流程
- 图像处理算法回顾基本框架
- 大数据学习之Scala中main函数的分析以及基本规则(2)
- okhttp框架的最简单的基本使用 post和get请求以及用gson解析请求的数据
- 了解SpringMVC框架及基本工作流程
- [深度学习] 反向传播的四个基本公式证明及算法流程
- 【数据处理】R语言--data.table介绍以及例子
- Struts 2 框架学习 第1part 基本开发流程
- [opencv]图像处理的基本数据类型以及通道和维度理解