python:pandas合并csv文件(图书数据集成)
2017-02-13 15:05
711 查看
数据集成:将不同表的数据通过主键进行连接起来,方便对数据进行整体的分析。
两张表:ReaderInformation.csv,ReaderRentRecode.csv
ReaderInformation.csv:
ReaderRentRecode.csv:
pandas读取csv文件,并进行csv文件合并处理:
合并后的csv文件:data.csv
通过使用pandas的函数merge来进行两个表的左连接,最后得到相应的data.csv文件。
两张表:ReaderInformation.csv,ReaderRentRecode.csv
ReaderInformation.csv:
ReaderRentRecode.csv:
pandas读取csv文件,并进行csv文件合并处理:
# -*- coding:utf-8 -*- import csv as csv import numpy as np # ------------- # csv读取表格数据 # ------------- ''' csv_file_object = csv.reader(codecs.open('ReaderRentRecode.csv', 'rb')) header = csv_file_object.next() print header print type(header) print header[1] data = [] for row in csv_file_object: data.append(row) data = np.array(data) print data[0::, 0] ''' # ------------- # pandas读取表格数据 # ------------- import pandas as pd df = pd.read_csv('ReaderRentRecode.csv') # 读者借阅信息表 ''' print df.head() print '----------------' print df[['读者证号', '读者姓名', '书名', '中图法分类号']] # 选取其中的四列 print '------------------------------------------------------------------' print ''' dd = pd.read_csv('ReaderInformation.csv') ''' print dd.head() print '----------------' print dd[['读者证号', '读者性别', '读者单位', '读者类别']] print '------------------------------------------------------------------' print ''' data = pd.merge(df, dd, on=['读者证号', '读者姓名'], how='left') # pandas csv表左连接 data = data[['读者证号', '读者姓名', '读者性别', '书名', '中图法分类号', '读者单位', '读者类别']] print data print '------------------------------------------------------------------' print # ------------- # pandas写入表格数据 # ------------- data.to_csv(r'data.csv', encoding='gbk')
合并后的csv文件:data.csv
通过使用pandas的函数merge来进行两个表的左连接,最后得到相应的data.csv文件。
相关文章推荐
- python:pandas合并csv文件的方法(图书数据集成)
- Python利用pandas计算多个CSV文件数据值的实例
- 用pandas将多个同格式csv数据文件合并
- python、pandas文件合并、数据去重
- 使用python pandas读取csv文件数据
- Python利用pandas计算多个CSV文件数据值
- Python使用pandas & pymysql读取MySQL数据到csv文件中
- python 37 pandas操作csv文件小结,csv文件合并
- 用Python的pandas框架操作Excel文件中的数据教程
- python/机器学习:读写机器学习中常用的.CSV数据文件t
- Python抓取CSV文件中数据【V2】
- 利用Python进行数据分析(12) pandas基础: 数据合并
- 利用python做数据分析(五)-读取合并多个文件
- Python 数据分析(一) 本实验将学习 pandas 基础,数据加载、存储与文件格式,数据规整化,绘图和可视化的知识
- python数据分析之(4)读写数据文件CSV,EXCEL等
- Python抓取CSV文件中数据
- python pandas IO tools 之read_csv文件读写参数详解
- python中写入csv,excel显示、pandas读取csv文件的编码问题
- Python使用cx_Oracle模块将oracle中数据导出到csv文件的方法
- python/pandas数据分析(十三)-数据清理、转换、合并,重塑