您的位置:首页 > 编程语言 > Python开发

跟小白学Python数据分析——批量提取PDF表格数据

2020-05-14 08:25 218 查看

我们现在有一份PDF数据,里面有三页,每页都有一样数据结构但数据不同的数据表,现在需要使用Python将它批量提取出来。 长按识别下方二维码,并关注公众号 回复“PDF”获取案例数据上回已经介绍了使用pdfplumber模块提取PDF表格数据,还没学习的请点击 跟小白学Python数据分析——提取PDF表格数据 今天我们继续使用它,只需要在上回的基础上使用for循环即可。有了上回经验,我们就直接上代码:

1import pdfplumber
2import pandas as pd
3
4# 创建一个空数据框
5df = pd.DataFrame()
6
7# 使用with语句打开pdf文件
8with pdfplumber.open("D:\\python\\cai\\5.pdf") as pdf:
9    # 使用for循环遍历每个pages
10    for page in pdf.pages:
11        # 取出当前页表格,结果为列表
12        d=page.extract_table()
13        # 将列表转为数据框
14        df1 = pd.DataFrame(d[1:], columns=d[0]) 
15        #添加至df数据框中
16        df = df.append(df1)
执行代码后,将得到了df数据框

是不是so easy 呢? 如果你喜欢本文,可以点击右下角在看
如果你在跟着学习,请在留言区留言:打卡
如果你刚看到本文,可以查看本系列历史文章跟着学习:
跟小白学Python数据分析——Anaconda安装
跟小白学Python数据分析——使用spyder
跟小白学Python数据分析——数据导入1
跟小白学Python数据分析——数据导入2

跟小白学Python数据分析——描述性统计分析

跟小白学Python数据分析——分组分析

跟小白学Python数据分析——列表

跟小白学Python数据分析——数据框

跟小白学Python数据分析——记录抽取

跟小白学Python数据分析——记录合并

跟小白学Python数据分析——数据导出

跟小白学Python数据分析——For循环

跟小白学Python数据分析——批量合并CSV文件

跟小白学Python数据分析——批量拆分Excel文件

跟小白学Python数据分析——提取PDF表格数据
-----------------长按识别下方二维码,并关注公众号
1.回复“PY”领取1GB Python数据分析资料
2.回复“BG”领取5GB 名企数据分析报告

                 

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: