借助python工具从word文件中抽取相关表的定义,最后组装建表语句-非常好
2018-01-31 15:40
369 查看
借助python工具从word文件中抽取表的定义,最后组装建表语句-非常好
--如有转载请以超链接的方式注明原文章出处,谢谢大家。请尊重每一位乐于分享的原创者
1.python脚本
2.document文件样本
3. 执行python操作
python parser_docx.py document.docx > create_table.sql
--如有转载请以超链接的方式注明原文章出处,谢谢大家。请尊重每一位乐于分享的原创者
1.python脚本
# # -*- coding:utf-8 -*- import sys from docx import Document file_path = sys.argv[1] document = Document(file_path) tables_info = {} for table in document.tables: rows = table.rows for index, row in enumerate(rows): if index == 0: table_name = row.cells[0].text tables_info[table_name] = {} elif index == 1: continue else: row_name = row.cells[1].text row_type = row.cells[2].text tables_info[table_name][row_name] = row_type for t_name, info in tables_info.items(): create_table_sql = "create table {t_name}(".format(t_name=t_name) for name, _type in info.items(): if name and _type: create_table_sql += '{} {},'.format(name, _type) create_table_sql = create_table_sql[:-1] + ');' print create_table_sql |
|
python parser_docx.py document.docx > create_table.sql
相关文章推荐
- python 读取文件 并实现文件相关操作最后导出excel
- Python导出MySQL数据库中表的建表语句到文件
- Python实现的用于从布局文件的id生成成员变量声明和findViewById语句的Android开发小工具
- Python逐行读取文件,到最后一行结束
- 十个非常好用的文件上传工具(插件)
- C# CLRInsideOut 托管代码与非托管代码互操作,产生相关调用代码的好工具 C++ 头文件转C# 的好工具(转
- Linux 查看磁盘分区、文件系统、使用情况的命令和相关工具介绍
- 利用POI抽取word中的图片并保存在文件中
- Linux 查看磁盘分区、文件系统、使用情况的命令和相关工具介绍
- sae-python相关工具
- 从BUG工具redmine上获取数据后借助python模块pycha 画出BUG分析类报表
- python读写word、excel、csv、json文件
- php中不借助IDE快速定位行数或者方法定义的文件和位置
- 文件系统挂载、卸载及相关的工具 ⑨
- Python - 批量转换Word文件为PDF文件
- Linux:文件格式化与相关处理及sed工具
- Python中列表和元组的相关语句和方法讲解
- 利用POI抽取word中的图片并保存在文件中
- Python pyc文件与code对象相关用法
- Office文件的奥秘——.NET平台下不借助Office实现Word、Powerpoint等文件的解析(1)