pandas入门
目录
import pandas as pd #导入
与numpy的联系与区别
pandas是在numpy基础上完成的
pandas用来处理表格或异质型数据,numpy用来处理同质性数据
1. pandas数据结构介绍
(1)Series
一维的数组对象,包含一个值序列(values)和索引(index)
obj=pd.Series([ ],index = [ ]) #生成
obj.values #值
obj.index #索引
obj[ ] #索引和切片
注:obj2['b':'d'] #非默认索引切片时是左闭右闭
obj[ ]= #修改
obj[obj>0] #过滤
np.exp(obj) #应用函数
obj2.drop( )、obj2.drop([ , ])#删除 注:要重新赋名称
pd.isnull(obj)、pd.notnull(obj)、obj.isnull() #检测缺失值
(2)DataFrame
数据表,包含已排序的列集合,每一列可以是不同的值类型
frame= pd.DataFrame(data, columns=[ , ], index=[ , ]) #生成
frame.head() #选出前几行
data.loc[ , [ , ]] #轴标签loc
data.iloc[ , [ , , ]] #整数标签iloc
#删除行 和Series一样
del frame2[ ]、frame.drop( ,axis=1) #删除列
f = lambda x: x.max() - x.min()
frame.apply(f) #对数据框每一行或每一列应用
(3)Series与DataFrame的关系
Series是DataFrame的一列
2. 描述性统计的概述和计算
df.sum() #求和
df.mean(axis='columns', skipna=False) #均值
df.idxmax()、df.idxmin() #每一列的最大值或最小值的index
df.cumsum() #累计值
df.describe() #汇总统计
uniques = obj.unique() #和Numpy一样
obj.value_counts() #每个元素出现的次数
pd.read_csv("1.csv") #从外部文件读入数据
pd.to_csv("2.csv") #存数据到文件
- Pandas 十分钟入门
- python学习笔记一(pandas入门)
- pandas教程[1]DataFrame入门 | pandas教程[2]DataFrame选择数据-1
- pandas入门
- python机器学习库入门之pandas
- 10分钟入门pandas(二)
- pandas入门(二)
- Python点滴(四)—pandas快速入门使用
- 《利用python进行数据分析》读书笔记--第五章 pandas入门
- Pandas入门笔记2-索引对象
- Pandas入门(上)
- Python数据分析|第5章 pandas入门
- Python入门 —— Pandas Day4【转载】
- Python数据分析入门之pandas基础总结
- pandas入门笔记
- Pandas入门
- Python爬虫(入门+进阶)学习笔记 1-5 使用pandas保存豆瓣短评数据
- 一文入门 Python 数据分析库 Pandas
- pandas入门(三)
- 教程 | pandas轻松入门 之 数据结构介绍 1