python 图片识别
简单分享下通过python来识别图片内的文字。
首先说一下环境,系统是在linux上(乌班图16.04),python版本为py3。
因为仅仅是测试一下,所以代码非常简单,但是却需要我们将几个库文件下载下来。
第一个先来安装一下PIL
在Debian/Ubuntu Linux下直接通过apt安装:$ sudo apt-get install python-imagingMac和其他版本的Linux可以直接使用easy_install或pip安装,安装前需要把编译环境装好:$ sudo easy_install PIL如果安装失败,根据提示先把缺失的包(比如openjpeg)装上。 Windows平台就去PIL官方网站下载exe安装包。
第二步来安装pytesseract
sudo pip3 install pytesseract
Tip: 如果没有sudo会提示权限不足。
我的乌班图里存在py2 和 py3 两个版本,所以对应的,我们在通过pip安装软件的时候,如果直接pip install 那么软件会安装在py2的环境下。
最后一步是来安装tesseract-orc引擎 。
先来安装下引擎的依赖:
sudo apt-get install libpng12-dev
sudo apt-get install libjpeg62-dev
sudo apt-get install libtiff4-dev
sudo apt-get install gcc
sudo apt-get install g++
sudo apt-get install automake
安装引擎:
sudo apt-get install tesseract-ocr
安装语言文件(英文、中文简体)sudo apt-get install tesseract-ocr-eng
sudo apt-get install tesseract-ocr-chi-sim如果需要什么文件,可以去官网下载 。 https://code.google.com/p/tesseract-ocr/downloads/list
from PIL import Image import pytesseract text=pytesseract.image_to_string(Image.open('denggao.jpg'),lang='chi_sim') print(text)代码下载地址:点击打开链接
- 点赞
- 收藏
- 分享
- 文章举报
- Python人工智能之图片识别
- Python+Opencv识别两张相似图片
- python爬取人脸识别图片数据集/python爬去图片/python爬虫
- tensorflow学习之识别单张图片的实现(python手写数字)
- python图片文本识别的简单实现
- Python 识别图片中表格
- Python爬虫之图片识别文字demo
- Python+Opencv识别两张相似图片
- 利用python进行识别相似图片
- python+opencv识别图片中的圆形
- 在Mac上 python中使用tesseract OCR (Pytesser) 识别图片中的文字
- Python将自己的图片数据集导入h5py,做识别的预处理
- Python图像处理之图片文字识别功能(OCR)
- 用Python人工智能识别图片-识别车牌号
- 基于python3 OpenCV3实现静态图片人脸识别
- python 使用 imagehash 和 distance 相似图片识别
- python3使用Pillow、tesseract-ocr与pytesseract模块的图片识别
- 利用python进行识别相似图片(一)
- Python3一行代码实现图片文字识别的示例
- Python实现图片中英文信息识别