文本识别 OCR 解决方案

Capture2Text 便携式 OCR 工具

Capture2Text 能够使用键盘快捷键快速对屏幕的一部分进行 OCR。 默认情况下,生成的文本将保存到剪贴板。支持中文、英文、法文、德文、日文、韩文、俄文、西班牙文等 90 多种语言。 Capture2Text 是便携式工具,不需要安装。

5fe7ba63177f34c22b21813d4291d186.png

Tesseract.js 识别图片语言的 JS 库

Tesseract.js 是一个几乎能识别出图片中所有语言文本的 JS 库。

acd28c93c08a91eceac46765a92a629d.png

Tesseract OCR 图像识别类库

Tesseract 是一款由 HP 实验室开发,后续由 Google 维护的开源 OCR 引擎,特点是开源、免费、支持多语言、多平台。

 

chineseocr_lite 轻量级中文 OCR

chineseocr_lite 是一个轻量级中文 OCR 项目,提供将图片上的中文转成字符串的功能。支持竖排文字,识别支持 ncnn、mnn、tnn 推理 (dbnet (1.8M) + crnn (2.5M) + anglenet (378KB)),总模型仅 4.7M。

Textinator macOS OCR 工具

Textinator 是一款简单的 macOS 状态栏 / 菜单栏应用程序,用于对屏幕截图执行自动文本检测。

MathOCR 数学公式识别系统

MathOCR 是用 Java 语言编写的一个印刷体数学公式识别系统,可以识别图片中数学公式并转换为相应的 LaTeX 代码。

树洞 OCR 文字识别 跨平台的 OCR 小工具

树洞 OCR 文字识别是一款跨平台的 OCR 小工具。xxx-with-jre.xx 是完整版,带运行环境;如果精简版不能正常工作,请下载完整版使用; 文字识别使用了各云平台开发的识别接口,因此需要联网才能正常使用;

MMOCR 基于 PyTorch 的文本检测工具

MMOCR 是基于 PyTorch 和 mmdetection 的开源工具箱,专注于文本检测,文本识别以及相应的下游任务,如关键信息提取。 该工具箱不仅支持文本检测和文本识别,还支持其下游任务,例如关键信息提取。

639a06de4d2b670fe27c4f12be2d1d41.png

PaddleOCR 基于飞桨的 OCR 工具库

PaddleOCR 是基于飞桨的 OCR 工具库,包含总模型仅 8.6M 的超轻量级中文 OCR,单模型支持中英文数字组合识别、竖排文本识别、长文本识别。同时支持多种文本检测、文本识别的训练算法。

Umi-OCR 离线文字识别工具

Umi-OCR 是一款免费、开源、可批量的离线 OCR 软件,基于 PaddleOCR,适用于 Windows10/11 平台。Umi-OCR可批量导入处理图片,结果保存到本地 txt /md/jsonl 多种格式文件。同时也可以即时截屏识别。

 

d21538ce0665669e268ea3f070630966.png

C-OCR 携程 OCR 项目

C-OCR 是携程自研的 OCR 项目,主要包括身份证、护照、火车票、签证等旅游相关证件、材料的识别。 项目包含 4 个部分,拒识、检测、识别、后处理。

MindOCR OCR 开发及应用工具箱

MindOCR 是一个基于 MindSpore 框架的 OCR 开发及应用的开源工具箱,可以帮助用户训练、应用业界最有优的文本检测、文本识别模型,例如 DBNet/DBNet++ 和 CRNN/SVTR,以实现图像文本理解的需求。

dpScreenOCR 轻量级 OCR 工具

dpScreenOCR 是一个自由的开源程序,用于识别屏幕上的文本。由 Tesseract 提供支持,它支持 100 多种语言,并且可以拆分独立的文本块,例如列。

5f000d8412908f6e1dbb93419d5fda61.png

RapidOCR 跨平台 OCR 库

RapidOCR 是一款基于 PaddleOCR & OnnxRuntime & OpenVINO 的跨平台 OCR 库。完全开源免费并支持离线快速部署,支持多平台, 默认是中英文,其他语言识别需要自助转换。

相关推荐

  1. OCR识别文字示例

    2024-04-06 17:32:01       42 阅读
  2. ocr、人工智能、文字识别接口

    2024-04-06 17:32:01       29 阅读
  3. OCR API、文字识别接口、文字录入

    2024-04-06 17:32:01       33 阅读
  4. Ocr识别

    2024-04-06 17:32:01       31 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-04-06 17:32:01       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-04-06 17:32:01       100 阅读
  3. 在Django里面运行非项目文件

    2024-04-06 17:32:01       82 阅读
  4. Python语言-面向对象

    2024-04-06 17:32:01       91 阅读

热门阅读

  1. ChatGPT Word 大师

    2024-04-06 17:32:01       44 阅读
  2. 网络安全常用命令

    2024-04-06 17:32:01       40 阅读
  3. 算法基础之组合数 I

    2024-04-06 17:32:01       36 阅读
  4. PDF格式解析:stream中图形状态保存指令q

    2024-04-06 17:32:01       37 阅读