python实现word图片文字分离
2013-11-07 16:30
751 查看
需要先装pywin32-218.win-amd64-py3.3
#coding:utf-8 from win32com import client as wc import os import glob word = wc.Dispatch('Word.Application') def wordsToHtml(dir): #得到要处理的word后缀为doc文件列表 filelist1 = glob.glob(dir+'\*.doc') #print (filelist1) for wardfullName in filelist1: doc = word.Documents.Open(wardfullName) htmlfullName = wardfullName[:-3]+'html' txtfullName = wardfullName[:-3]+'txt' print('正在处理图片----------'+htmlfullName) print('正在处理文字----------'+txtfullName) doc.SaveAs(htmlfullName, 10) doc.SaveAs(txtfullName,5) os.remove(htmlfullName) print('正在删除html文件----------'+htmlfullName) doc.Close() #得到要处理的word后缀为docx文件列表 filelist2 = glob.glob(dir+'\*.docx') #print (filelist2) for wardfullName in filelist2: doc = word.Documents.Open(wardfullName) htmlfullName = wardfullName[:-4]+'html' txtfullName = wardfullName[:-4]+'txt' print('正在处理图片----------'+htmlfullName) print('正在处理文字----------'+txtfullName) doc.SaveAs(htmlfullName, 10) doc.SaveAs(txtfullName,5) os.remove(htmlfullName) print('正在删除html文件----------'+htmlfullName) doc.Close() word.Quit() if __name__ == '__main__': ddir = r'F:\python' wordsToHtml(ddir)
相关文章推荐
- Java 实现word 中写入文字图片的解决方案
- Java 实现word 中写入文字图片的解决方案
- Java 实现word 中写入文字图片的解决方案
- 关于如何用WORD实现图片转文字
- 使用poi替换word中的文字和图片实现打印
- 图片上的文字转换成word的实现方法
- 利用python pil 实现给图片上添加文字
- python3实现获取图片中的文字含中文
- Python人工智能之图片识别,Python3一行代码实现图片文字识别
- 用C#操作office组件库实现word文档的创建及文字 表格 图片的插入
- 老大要求把Word文档加上公司的标识,公司名文字或者logo图片都可以,但要求是用电脑打开(电子文档时)能看见标识,如果打印出来(纸质文档)就不显示出来,如何实现?
- python3.5 实现图片转文字
- Python3一行代码实现图片文字识别的示例
- Linux python PyQt5调用百度API实现图片文字转换
- 百度AI实现图片转文字-python
- Python实现中文词云(wordcloud),根据背景图片生成词云
- python复制word中的内容,包括格式、图片、文字
- .net 下word 中的图片与文字分离
- Gallery实现图片文字左右滑动放大当前选中
- UIButton实现左文字右图片