跟小白学Python数据分析——批量提取PDF表格数据
2020-05-14 08:25
218 查看
我们现在有一份PDF数据,里面有三页,每页都有一样数据结构但数据不同的数据表,现在需要使用Python将它批量提取出来。
长按识别下方二维码,并关注公众号
回复“PDF”获取案例数据上回已经介绍了使用pdfplumber模块提取PDF表格数据,还没学习的请点击 跟小白学Python数据分析——提取PDF表格数据 今天我们继续使用它,只需要在上回的基础上使用for循环即可。有了上回经验,我们就直接上代码:
1import pdfplumber 2import pandas as pd 3 4# 创建一个空数据框 5df = pd.DataFrame() 6 7# 使用with语句打开pdf文件 8with pdfplumber.open("D:\\python\\cai\\5.pdf") as pdf: 9 # 使用for循环遍历每个pages 10 for page in pdf.pages: 11 # 取出当前页表格,结果为列表 12 d=page.extract_table() 13 # 将列表转为数据框 14 df1 = pd.DataFrame(d[1:], columns=d[0]) 15 #添加至df数据框中 16 df = df.append(df1)执行代码后,将得到了df数据框
是不是so easy 呢?
如果你喜欢本文,可以点击右下角在看
如果你在跟着学习,请在留言区留言:打卡
如果你刚看到本文,可以查看本系列历史文章跟着学习:
跟小白学Python数据分析——Anaconda安装
跟小白学Python数据分析——使用spyder
跟小白学Python数据分析——数据导入1
跟小白学Python数据分析——数据导入2
跟小白学Python数据分析——提取PDF表格数据
-----------------长按识别下方二维码,并关注公众号
1.回复“PY”领取1GB Python数据分析资料
2.回复“BG”领取5GB 名企数据分析报告
相关文章推荐
- Python 用三行代码提取PDF表格数据
- Python新工具:用三行代码提取PDF表格数据
- Python使用Tabula提取PDF表格数据
- Python编程神器:3行代码提取PDF表格数据
- 利用Python做数据分析(一)--批量读取数据
- 利用Python进行数据分析 PDF 分享
- 小白学 Python 数据分析(15):数据可视化概述
- 小白学 Python 数据分析(4):Pandas (三)数据结构 DataFrame
- 利用Python进行数据分析.pdf
- 小白学 Python 数据分析(3):Pandas (二)数据结构 Series
- python数据分析&自动化办公实战(二):批量输入输出excel文件
- 小白学 Python 数据分析(17):Matplotlib(二)基础操作
- Python批量提取PDF文件中的文本
- 视频教程-数据分析小白入门指南-Python
- [SQL Server玩转Python] 二.T-SQL查询表格值及Python实现数据分析
- 小白学 Python 数据分析(2):Pandas (一)概述
- python数据分析-处理CSV/EXCEL表格文件
- 小白学 Python 数据分析(1):数据分析基础
- 学习笔记(17):Python数据分析与爬虫-常用正则表达式及正则匹配实例:提取数字、匹配电话号码及QQ号...
- 小白学 Python 数据分析(16):Matplotlib(一)坐标系