Tess4J 简单使用入门[通俗易懂]

全栈程序员-用户IM • 2022年6月11日上午7:46 • 未分类

Tess4J 简单使用入门[通俗易懂]Tesseract-OCR支持中文识别，并且开源和提供全套的训练工具，是快速低成本开发的首选。而Tess4J则是Tesseract在JavaPC上的应用。在英文和数字识别中性能还是不错的，但是在中文识别中，无论速度还是识别率还是较弱，建议有条件的话，针对场景进行训练，会获得较好结果，本文仅对目前Tess4J的用法进行介绍。———————本文来自jian_cheng_90的CSDN博客，全文地址请点击：https://blog.csdn.net/risky

大家好，又见面了，我是你们的朋友全栈君。

一.简介

Tesseract-OCR支持中文识别，并且开源和提供全套的训练工具，是快速低成本开发的首选。而Tess4J则是Tesseract在Java PC上的应用。在英文和数字识别中性能还是不错的，但是在中文识别中，无论速度还是识别率还是较弱，建议有条件的话，针对场景进行训练，会获得较好结果，本文仅对目前Tess4J的用法进行介绍

二.入门教程

1.去Tess4J官网下载最新的源码包

我们现在最新的是3.4.8

Tess4J-3.4.8-src下载地址.

2.创建Java项目并配置Tess4J

下载下来的Tess4J目录一般都是如下

在这里插入图片描述

dist:综合jar,不需要配置dll
lib:所有相关的jar包
src:源码包
tessdata:训练好的字体模型
test:测试用例

这里要把dist下的jar包和lib下的jar包都要导入Java项目中

3.一个Demo

 		File file = new File("D:\\1.jpg");
        ITesseract instance = new Tesseract();
        instance.setDatapath("...");//设置你的Tess4J下的tessdata目录
        instance.setLanguage("eng");//指定需要识别的语种
        String result = instance.doOCR(file);
        System.out.println(result);

其中语种就在tessdata目录下

在这里插入图片描述

你如果要识别的是其他语种
可以去其他语种.把对应的traineddata下载放这里

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至举报，一经查实，本站将立刻删除。

发布者：全栈程序员-用户IM，转载请注明出处：https://javaforall.cn/132239.html原文链接：https://javaforall.cn

【正版授权，激活自己账号】： Jetbrains全家桶Ide使用，1年售后保障，每天仅需1毛

【官方授权正版激活】： 官方授权正版激活支持Jetbrains家族下所有IDE 使用个人JB账号...

赞 (0)

全栈程序员-用户IM

0 0

这一次，终于系统的学习了 JVM 内存结构

这一次，终于系统的学习了 JVM 内存结构最近在看《JAVA并发编程实践》这本书，里面涉及到了Java内存模型，通过Java内存模型顺理成章的来到的JVM内存结构，关于JVM内存结构的认知还停留在上大学那会的课堂上，一直没有系统的学习这一块的知识，所以这一次我把《深入理解Java虚拟机JVM高级特性与最佳实践》、《Java虚拟机规范JavaSE8版》这两本书中关于JVM内存结构的部分都看了一遍，算是…

全栈程序员-用户IM
2022年6月7日
C#里面文本的三种换行方式「建议收藏」

C#里面文本的三种换行方式

全栈程序员-用户IM
2022年3月7日
常量表达式概念与用处的关系_常量和变量有什么异同点

常量表达式概念与用处的关系_常量和变量有什么异同点1）什么叫常量表达式？在编译期间进行求值的表达式。 1、字面值常量是常量表达式；如123，‘a’，3.14等 2、用常量表达式初始化的const对象也是常量表达式。如intconsta=5；语句中a就是常量表达式2）什么地方会用到常量表达式？就目前所知道的有三个，后面如果发现再新增。

全栈程序员-用户IM
2022年9月29日
关于代理服务器的原理及用法「建议收藏」

关于代理服务器的原理及用法「建议收藏」关于代理服务器的原理及用法一，什么是代理服务器（Proxy）？答:以类似代理人的身份去取的用户需要的数据。由于它的【代理】能力，使得我们可以透过代理服务器来达成防火墙与用户数据的分析。除此之外我们还可以借助代理服务器来达成节省带宽的目的，以及加快内部网络对因特网的万维网的访问速度。当客户端有因特网的数据要求时，Proxy会帮用户去向目的地取得用户所需要的数据。所以当客户端指定www的代理服务器之后，用户的所有www相关要求就会通过代理服务器去捉取。代理服务器会架设在整个区网的单点对外防火墙上头，而在区

全栈程序员-用户IM
2022年5月4日
java工程师面试题及答案_实施工程师面试问题

java工程师面试题及答案_实施工程师面试问题内容涵盖：Java、MyBatis、ZooKeeper、Dubbo、Elasticsearch、Memcached、Linux等技术栈。

全栈程序员-用户IM
2022年10月15日
FPGA实现uart_FPGA的EMU接口

FPGA实现uart_FPGA的EMU接口一、顶层设计思路：UART即通用异步收发传输接口（UniversalAsynchronousReceiver/Transmitter），简称串口，是一种常用的通信接口，其协议原理就不赘述了，不了解的可以百度。（不赘述不代表不重要，相反，对于每一个FPGA设计，充分理解原理是基础和前提，而FPGA和Verilog只是工具。）用FPGA来实现UART，关键就是要将UART收发数据时的时序用Verilog描述出来。根据UART协议的原理，可以将整个UART分为两个模块…

全栈程序员-用户IM
2022年9月14日

发表回复

关注全栈程序员社区公众号