pandas中read_csv的缺失值处理方式
2020-02-13 12:54
218 查看
今天遇到的问题是,要将一份csv数据读入dataframe,但某些列中含有NA值。对于这些列来说,NA应该作为一个有意义的level,而不是缺失值,但read_csv函数会自动将类似的缺失值理解为缺失值并变为NaN。
看pandas文档中read_csv函数中这两个参数的描述,默认会将'-1.#IND', ‘1.#QNAN', ‘1.#IND', ‘-1.#QNAN', ‘#N/A N/A','#N/A', ‘N/A', ‘NA', ‘#NA', ‘NULL', ‘NaN', ‘-NaN', ‘nan', ‘-nan', ''转换为NaN,且na_values参数还支持定义另外的应处理为缺失值的值。
值得注意的是keep_default_na参数,这个参数的作用是决定要不要保留默认应该转换的缺失值列表,将这个参数设为False之后同时不定义na_values参数,就可以在读取文件时不将任何值转换为缺失值NaN。
例:
import pandas as pd df = pd.read_csv('train.csv', keep_default_na=False)
以上这篇pandas中read_csv的缺失值处理方式就是小编分享给大家的全部内容了,希望能给大家一个参考
您可能感兴趣的文章:
相关文章推荐
- 利用numpy和pandas处理csv文件中的时间方法
- Python数据分析之pandas.read_csv参数说明
- pandas.read_csv参数整理
- pandas21 读csv文件read_fwf读固定宽度数据(详细 tcy)
- pandas 排序(sort_values);读取csv文件 read_csv
- Pandas基础——处理缺失值
- pandas 之read_csv()参数
- Pandas处理csv表格
- pandas数据预处理实训题目(1缺失数据处理,2逐渐合并,3数据标准化)
- 如何解决pandas.read_csv()乱码问题
- pandas空值(缺省/失值)处理方式---数据清洗
- pandas.read_csv——分块读取大文件
- pandas.read_csv参数解释
- pandas21 读csv文件read_csv(1.文本读写概要)(详细 tcy)
- 解决pandas使用read_csv()读取文件遇到的问题
- 利用Python进行数据分析(10) pandas基础: 处理缺失数据
- POI CSV方式处理大数据excel文件
- Pandas | 17 缺失数据处理
- pandas读取csv文件进行处理时报错: TypeError: invalid type compariso
- pandas处理csv数据基本用法