python tesseract识别图片文字第一次尝试中的问题记录qwq
2018-06-22 21:11
513 查看
操作系统MacOS High Sierra。
哪里有问题热烈欢迎指正!( •̀ .̫ •́ )✧
菜鸡就不用别的IDE了,因为电脑里已经有eclipse,就直接在eclipse里配了一下然后建Python工程啦!
东西的话基本都是用homebrew下的。用homebrew,贼放心!(就有时候稍微有点慢
先在命令行里试了下tesseract的基础操作,没啥问题。
然后就搓手手期待地在新建的工程里写了单张图像识别的几句话。
这样↓
import pytesseract from PIL import Image image=Image.open('/Users/ann/Downloads/chitest.png'); text=pytesseract.image_to_string(image,lang='chi_sim'); print(text)然后高高兴兴点了Run As。报的错比这可怜的几行代码还多...
然后我就仔细看了一下!前面都是包内第几行报错了,往下看看到最下面!发现:
pytesseract:TesseractNotFound Error: tesseract is not installed or it's not in your path.
他竟然说!找不到tesseract!然后去pytesseract包里找一下,想看看什么情况下会提示这个。
打开pytesseract.py,发现了这个↓
# CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY tesseract_cmd = 'tesseract' RGB_MODE = 'RGB'IF IS NOT IN YOUR PATH!就是你了皮卡丘!
然后我就想,会不会是tesseract_cmd这里出了问题。(我的菜不允许我多想
然后我就顺着控制台报的error点进去,在IDE里打开了这个.py,加了一句话(第三行)。
after:
# CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY tesseract_cmd = 'tesseract' tesseract_cmd = r'/usr/local/bin/tesseract' //这个路径是在命令行里敲which tesseract找到的 RGB_MODE = 'RGB'然后高高兴兴点Save。
然后提示我:balabala这个文件是Read-Only的。我:
那我就粗暴地在终端里 vim强行INSERT了!
:wq之后,没提示啥。再打开一次看一下,确定改掉了,某问tei了。
回eclipse重新运行!可以了!!!!!!!!
现在的问题是,测试的图很清楚的,但输出的结果是“疑是银河落九夭u”……
这两天再抽空把基础的训练方法学一下!(*•̀ㅂ•́)و
记录下来,顺道分享给跟我遇到同样问题的朋友~
阅读更多相关文章推荐
- python 包的使用 (二)——tesseract识别图片中的文字
- Python+pytesseract+Tesseract-OCR图片文字识别(只适合新手)
- Python(应用) — Tesseract图片文字识别(一)
- python 使用pytesseract图片文字识别
- Python使用OCR技术识别图片中的文字(入门篇)
- 第一次尝试使用tensorflow来识别图片
- Python_文字识别引擎试用:tesseract-ocr
- Python--文字识别--Tesseract
- 如何使用tesseract-ocr4.0识别图片文字
- python 识别图片中的文字信息
- 在Mac上 python中使用tesseract OCR (Pytesser) 识别图片中的文字
- Python图像处理之图片文字识别(OCR)
- Tesseract 3.02 OCR文字识别调查记录
- 第一次尝试用python来编程实现“helloworld”,顺利成功,过程中遇到几个小问题
- Java中使用tess4J(Tesseract-OCR)进行图片文字识别(支持中文)
- 如何使用tesseract-ocr4.0识别图片文字
- python3使用Pillow、tesseract-ocr与pytesseract模块的图片识别
- 图像识别API Python 指定文件夹图片内容转化为文字
- python + tesseract OCR 文字识别
- 使用Tesseract-OCR训练文字识别记录