您的位置:首页 > 编程语言 > Java开发

Java OCR tess4j 图片识别技术(三)

2017-06-15 17:44 405 查看

先贴代码段

tess4j整个的代码调用到时是蛮简单的。

1.先去官网下载:http://tess4j.sourceforge.net/

我的是Tess4J-3.4.0版,目录如下:



2.新建项目,将lib,tessdata,src复制到新建的项目中

3.将lib下的jar包加到build path 中

项目目录如下:



接下来就可以写一写测试了:

import java.io.File;

import net.sourceforge.tess4j.ITesseract;
import net.sourceforge.tess4j.Tesseract;
import net.sourceforge.tess4j.TesseractException;

public class Tess4j {
public static void main(String[] args) {
//图片所在文件夹
testTess4j("E:\\TestCode");
}
public static void testTess4j(String filePath){
File root = new File(filePath);
ITesseract instance = new Tesseract();

try {
File[] files = root.listFiles();
for (File file : files) {
String result = instance.doOCR(file);
String fileName = file.toString().substring(file.toString().lastIndexOf("\\")+1);

4000
System.out.println("图片名:" + file.toString() +" 识别结果:"+result);
}
} catch (TesseractException e) {
System.err.println(e.getMessage());
}
}
}


4.这时候可以运行了,但是会报错,如下:

Exception in thread "main" java.lang.UnsatisfiedLinkError: Unable to load library 'libtesseract304': Native library (win32-x86-64/libtesseract304.dll) not found in resource path ([file:/G:/Eclipse/Demo/bin/, file:/G:/Eclipse/Demo/lib/commons-beanutils-1.9.2.jar, file:/G:/Eclipse/Demo/lib/commons-io-2.4.jar, file:/G:/Eclipse/Demo/lib/commons-logging-1.2.jar, file:/G:/Eclipse/Demo/lib/ghost4j-1.0.1.jar, file:/G:/Eclipse/Demo/lib/hamcrest-core-1.3.jar, file:/G:/Eclipse/Demo/lib/itext-2.1.7.jar, file:/G:/Eclipse/Demo/lib/jai-imageio-core-1.3.1.jar, file:/G:/Eclipse/Demo/lib/jna-4.2.2.jar, file:/G:/Eclipse/Demo/lib/jul-to-slf4j-1.7.19.jar, file:/G:/Eclipse/Demo/lib/junit-4.12.jar, file:/G:/Eclipse/Demo/lib/lept4j-1.1.2.jar, file:/G:/Eclipse/Demo/lib/log4j-1.2.17.jar, file:/G:/Eclipse/Demo/lib/logback-classic-1.1.6.jar, file:/G:/Eclipse/Demo/lib/logback-core-1.1.6.jar, file:/G:/Eclipse/Demo/lib/rococoa-core-0.5.jar, file:/G:/Eclipse/Demo/lib/slf4j-api-1.7.19.jar, file:/G:/Eclipse/Demo/lib/xmlgraphics-commons-1.5.jar])


** 解决方法是:将lib下的win32-x86-64放到项目的bin文件夹下

5.执行结果



tess4j的数字+字母 识别效果比tesseract工具要好一些。

中文的话后期探索!

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: