初探pandas——安装和了解pandas数据结构
2020-07-04 09:50
330 查看
安装pandas
通过python pip安装pandas
pip install pandas
pandas数据结构
pandas常用数据结构包括:Series和DataFrame
Series
Series是一种一维的数组型对象,包含一个值序列(与numpy中的数据类型相似),数据标签(称为索引(index))。
import pandas as pd # 创建Series对象 obj=pd.Series([4,5,6,7]) print(obj)
0 4 1 5 2 6 3 7 dtype: int64
左边为索引,右边为值,默认索引从0到n-1(n为数据长度),可以通过values属性和index属性分别获得Series对象的值和索引
print(obj.values)
array([4, 5, 6, 7], dtype=int64)
print(obj.index)
RangeIndex(start=0, stop=4, step=1)
# 自定义索引序列 obj2=pd.Series([4,5,6,7],index=['a','b','d','e']) print(obj2,'\n') # 输出索引 print(obj2.index)
a 4 b 5 d 6 e 7 dtype: int64 Index(['a', 'b', 'd', 'e'], dtype='object')
Series对象可以使用标签来进行索引
# 输出索引为b的元素 print(obj2['b']) # 输出索引为a,d,e的元素 print('* '*10) print(obj2[['a','d','e']])
5 * * * * * * * * * * a 4 d 6 e 7 dtype: int64
Series对象也能使用布尔值进行过滤
# 输出值大于5的元素 print(obj2[obj2>5])
d 6 e 7 dtype: int64
DataFrame
DataFrame表示矩阵的数据表,包含已排序的列集合,每一列可以是不同的的值类型(数值、字符串、布尔值等)
DataFrame既有行索引,也有列索引,可以被视为一个共享相同索引的Series的字典
# 创建DataFrame对象 data={'age':[18,18,18,20,20,20],'name':['a','b','c','aa','bb','cc'],'height':[180,180,180,182,182,182]} frame=pd.DataFrame(data) print(frame)
age name height 0 18 a 180 1 18 b 180 2 18 c 180 3 20 aa 182 4 20 bb 182 5 20 cc 182
DataFrame也可以用columns参数指定列索引顺序排列
frame=pd.DataFrame(data,columns=['name','age','height']) print(frame)
name age height 0 a 18 180 1 b 18 180 2 c 18 180 3 aa 20 182 4 bb 20 182 5 cc 20 182
如果传的列参数不在字典中,将会出现缺失值
frame=pd.DataFrame(data,columns=['name','age','height','addition']) print(frame) print(frame.columns)
name age height addition 0 a 18 180 NaN 1 b 18 180 NaN 2 c 18 180 NaN 3 aa 20 182 NaN 4 bb 20 182 NaN 5 cc 20 182 NaN Index(['name', 'age', 'height', 'addition'], dtype='object')
DataFrame的一列可以按字典型标记或属性那样索引为Series
frame=pd.DataFrame(data,columns=['name','age','height']) print(frame['name']) print(frame.age)
0 a 1 b 2 c 3 aa 4 bb 5 cc Name: name, dtype: object 0 18 1 18 2 18 3 20 4 20 5 20 Name: age, dtype: int64
行也可以通过位置或特殊属性loc进行索引
frame=pd.DataFrame(data,columns=['name','age','height']) print(frame.loc[2])
name c age 18 height 180 Name: 2, dtype: object
相关文章推荐
- nginx初探-安装部署
- 了解magento 数据结构
- ios修改了coredata数据结构后,更新安装会闪退
- Python数据分析——Pandas数据结构和操作
- cnetos6.4 x64 阿里云环境初探--安装pip,及pymysql
- Python之matplotlib和pandas 模块安装
- 正式学习java并安装配置开发环境之前,了解一些java的专业术语
- 安装 geopandas 时出现错误 Command "python setup.py egg_info" failed with error code 1
- Python量化学习:Python软件、Numpy、scipy、pandas数据库的安装
- python 安装pandas 出现InsecurePlatformWarning: A true SSLContext object is not available.
- hubot安装初探
- sass了解以及安装
- 初学Pandas--Series存储不同类型对象的数据结构
- Pandas数据结构之Series(序列)
- ROS学习手记 - 1了解并安装ROS+创建ROS_Package
- 学习J2EE第三天(Cloudscape数据库的安装和了解)
- python 3.x 安装Matplotlib,Pandas等的方法
- 记conda 安装geopandas遇到的一个小错误
- github安装&初探
- pandas已安装,导入模块却显示ImportError,教你一步解决!