您的位置:首页 > 理论基础 > 数据结构算法

R语言基础 - 数据结构

2017-02-18 20:53 218 查看
1. 对象的五种基本类型(classes of objects)

  - 字符(character)

  - 数值(numeric:real numbers)

  - 整数(integer)

  - 复数(complex):1+2i

  - 逻辑(logical:True / False)

  




2. 属性(attribute)

  - 名称(name)

  - 维度(dimensoins:matrix,array)

  - 类型(class)

  - 长度(length)

3. 数据结构

  - 向量(vector):只能包含同一类型的对象

    1. vector()

    2. c()

    3. as.logical() / as.numeric() / as.character()

    


  - 矩阵(matrix):向量+维度属性(整数向量:nrow,ncol)

    1. matrix() :先列后行

    2. vector() + dim()

    3. cbind(),rbind()

    4. attributes()

    


  - 数组(array):与矩阵相似,但是维度可以大于2

    


  - 列表(list):可以包含不同类型的对象

    


  - 因子(factor):

    1. 分类数据 / 有序 vs. 无序

    2. 整数向量+标签(label)(优于整数向量)

      - Male / Female vs. 1 / 2

      - 常用于 lm(),glm()

    3. 创建因子

      - factor()

      - table() / unclass()

    


  - 缺失值(missing value)

    1. NA / NaN:NaN属于NA,NA不属于NaN

    2. NA有类型属性:interger NA,character NA等

    3. is.na() / is.nan()

    


  - 数据框(data frame)

    1. 存储表格数据(tabular data)

    2. 视为各元素长度相同的列表

      - 每个元素代表一列数据

      - 每个元素的长度代表行数

      - 元素类型可以不同

    


  - 日期 与 时间(date,time)

    1. 日期:Date

      - 距离1970-01-01的天数 / date() / Sys.Date()

      - weekdays() / months() / quarters()

    


    2. 时间:POSIXct / POSIXIt

      - 距离1970-01-01的秒数 / Sys.time()

      - POSIXct:整数,常用于存入数据框

      - POSIXlt:列表,还包含星期、年、月、日等信息

    


    3. 字符 => 日期 / 时间

      - as.Date()

      - as.POSIXct() / as.POSIXlt() / strptime()

4. 小结

  
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: