利用Tess4J实现图片文字识别

2024-04-14 19:38:07
开发
15

利用Tess4J实现图片文字识别

前言

光学字符识别（OCR）技术允许计算机通过扫描仪、摄像头等设备来识别并转换印刷或手写文本的图像数据为可编辑的文本格式。Tess4J是一个优秀的Java库，提供了与Tesseract OCR引擎的集成，方便进行图片文字识别。

1.创建项目导入tess4j对应的依赖

代码如下：

    <dependency>
    <groupId>net.sourceforge.tess4j</groupId>
    <artifactId>tess4j</artifactId>
    <version>4.1.1</version>
    </dependency>

2.编写测试类进行测试

代码如下：

import net.sourceforge.tess4j.ITesseract;
import net.sourceforge.tess4j.Tesseract;

import java.io.File;

public class Application {
    /**
     * @Description:识别图片中的文字
     * @param args
     */
    public static void main(String[] args) {
        try {
            //获取本地图片
            File file = new File("E:\\file\\aa.png");
            //创建Tesseract对象
            ITesseract tesseract = new Tesseract();
            //设置字体库路径
            tesseract.setDatapath("E:\\file");
            //设置语言简体中文
            tesseract.setLanguage("chi_sim");
            //执行ocr识别图片
            String result = tesseract.doOCR(file);
            //替换回车和tal键  使结果为一行
            result = result.replaceAll("\\r|\\n","-").replaceAll(" ","");
            System.out.println("识别的结果为："+result);
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
}

原文地址:https://blog.csdn.net/qq_40408662/article/details/137727238 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1779474207818780672.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部

利用Tess4J实现图片文字识别

利用Tess4J实现图片文字识别

前言

1.创建项目导入tess4j对应的依赖

2.编写测试类进行测试

相关推荐

最近更新

热门阅读