您的位置:首页 > 其它

R语言笔记1:R语言对象的数据类型(向量、数组、矩阵、 列表和数据框)

2018-02-26 15:31 316 查看

R语言中的数据类型(Data Types)

R语言的对象(Objects)主要包括向量、矩阵、数组、数据框和列表。



R语言的对象有五种最基本的类型,即,字符型(character)、数值型(numeric,包括小数)、整型(integer)、复数型(complex)以及逻辑型(logical,TRUE/FALSE)

属性是R语言对象的一部分。主要包括以下几种:名字(names,dimnames),维度(dimensions,包括矩阵等),类别(class,包括数字、整数等),长度(length),以及其他。可通过
attributes()
函数查看对象的属性,不是所有对象都有属性,如果没有则返回NULL。

1. 向量

向量(vector)是R语言中最基本的数据类型,执行组合功能的函数
c()
可用来创建向量。

各类向量如下例所示:

a <- c (1, 2, 7, -4, 5)            ## numeric
b <- c ("Rice", "Wheat")           ## character
c <- c (TRUE, TRUE, FALSE, TRUE)   ## logical
d <- c (1+0i, 2+4i)                ## complex
e <- c (9:17)                      ## integer


注意:单个向量中的数据必须拥有相同的类型(数值型、字符型或逻辑型)。

创建空向量可以使用
vector()
函数。例如创建一个指定长度为10、类型为数值型的空向量:

> x <- vector("numeric", length = 10)
> x
[1] 0 0 0 0 0 0 0 0 0 0


另外,标量是只含一个元素的向量,它们用于保存常量。例如

f <- 3
g <- "US"
h <- TRUE


2. 矩阵

矩阵(matrice)是具有维度属性的向量,矩阵都是二维的,和向量类似,矩阵中也仅能包含一种数据类型。

主要有三种创建矩阵的方法:

(1)直接创建

例:数字1-20自动创建为一个5行4列的矩阵,自动填充第一列之后开始填充第二列

y <- matrix(1:20, nrow = 5, ncol = 4)
> y
[,1] [,2] [,3] [,4]
[1,]    1    6   11   16
[2,]    2    7   12   17
[3,]    3    8   13   18
[4,]    4    9   14   19
[5,]    5   10   15   20
> dim(y)
[1] 5 4                            ##dim()看维度,5行4列


(2)矢量+维度向量

添加维度向量
dim()
是将矢量转变为矩阵的方法

> m <- c(1:10)
> m
[1]  1  2  3  4  5  6  7  8  9 10
> dim(m) <- c(2,5)                   ##2行5列
> m
[,1] [,2] [,3] [,4] [,5]
[1,]    1    3    5    7    9
[2,]    2    4    6    8   10


(3)绑定行或列来创建矩阵

绑定行或绑定列可以通过
cbind()
rbind()
来实现

> x <- 1:3
> y <- 10:12
> cbind (x, y)
x  y
[1,] 1 10
[2,] 2 11
[3,] 3 12
> rbind (x, y)
[,1] [,2] [,3]
x    1    2    3
y   10   11   12


3. 数组

数组(array)与矩阵类似,但是维度可以大于2。数组可通过array函数创建。

4. 列表

列表(list)是一种可包含多种不同类型对象的向量,是一些对象(或成分,component)的有序集合。

> x <- list(1, "a", TRUE, 1 + 4i)
> x
[[1]]
[1] 1

[[2]]
[1] "a"

[[3]]
[1] TRUE

[[4]]
[1] 1+4i


5.数据框

数据框(Data Frames)是一种特殊的列表,其中所用元素长度都相等,列表中的每个元素都可以看作一列,每个元素的长度可以看作行数。

创建显式数据框的方法是
data.frame()


> ID <- c(1,2,3,4)
> age <- c(25,26,55,43)
> diabetes <- c("Type1","Type2","Type3","Type1")
> status <- c("Poor", "Improved", "Excellent","Poor")
> data <- data.frame(ID, age, diabetes, status)
> data
ID age diabetes    status
1  1  25    Type1      Poor
2  2  26    Type2  Improved
3  3  55    Type3 Excellent
4  4  43    Type1      Poor


参考资料:

1. Coursera视频课程:https://www.coursera.org/learn/r-programming/home/welcome R Programming, Johns Hopkins University

2. https://bookdown.org/rdpeng/rprogdatascience/R Programming for Data Science

3. 《R语言实战》 Robert I. Kabacoff
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: