推荐两个 yyds 的开源项目!

本期推荐开源项目目录:

1. 一款支持90+语言的全能文档OCR工具包

2. 实时全身姿态估计工具


01

一款支持90+语言的全能文档OCR工具包

Surya 是一个功能强大的文档OCR工具包,由 VikParuchuri 开发。它不仅支持超过 90 种语言的光学字符识别(OCR),而且在与云服务的基准测试中表现优异。

Surya 能够进行线级文本检测、布局分析(如表格、图像、标题等的检测)以及阅读顺序的识别,适用于多种文档类型。

  • 多语言支持:Surya 支持90多种语言的OCR,使其成为一个真正的多语言解决方案。

  • 线级文本检测:能够识别任何语言的文本行。

  • 布局分析:可以检测文档中的表格、图像、标题等元素。

  • 阅读顺序检测:能够识别文本的阅读顺序,优化信息的获取。

Surya 还包括了一个基于Streamlit的交互式应用程序,允许用户以交互方式尝试对图像或PDF文件进行OCR。

Surya 的模型权重采用 cc-by-nc-sa-4.0 许可,但对于年收入或终身风险投资低于500万美元的组织免费。

开源地址:https://github.com/VikParuchuri/surya

支持中文

7571987727fb46081aadc6634a9cee87.jpeg

排版

ba43f1b73171b2b2ff48978eb4f26dc6.jpeg阅读顺序提取

2902068601a692824ac5a91eb2d5f3b5.jpeg

ocr 识别

d9be05b145964bdfa5fe40971c3b7d7d.jpeg

02

实时全身姿态估计工具

MusePose是由TMElyralab开发的一款开源的实时全身姿态估计工具。它利用最新的计算机视觉技术,能够在多种设备上实现高精度的人体姿态跟踪。

  • 实时性能:MusePose能够在实时环境中准确估计人体姿态。

  • 全身追踪:支持从头到脚的全身关键点检测。

  • 多平台兼容性:可以在多种设备上运行,包括移动设备和桌面计算机。

开源地址:https://github.com/TMElyralab/MusePose


推荐阅读

1. GitHub 上有什么好玩的项目?

2. 推荐 5 个本周很火的 GitHub 项目

3. 推荐 5 个近期火火火的 GitHub 项目

4.  推荐 5 个令人惊艳的 GitHub 项目

7f710b4208c1154465bc31caaa8721dd.png

相关推荐

  1. 12 yyds 开源鸿蒙实战项目

    2024-06-09 07:50:05       52 阅读
  2. 推荐可以直接使用ChatGPT 开源应用

    2024-06-09 07:50:05       43 阅读
  3. ChatTTS开源项目推荐

    2024-06-09 07:50:05       30 阅读
  4. 热门开源项目推荐

    2024-06-09 07:50:05       28 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-06-09 07:50:05       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-06-09 07:50:05       100 阅读
  3. 在Django里面运行非项目文件

    2024-06-09 07:50:05       82 阅读
  4. Python语言-面向对象

    2024-06-09 07:50:05       91 阅读

热门阅读

  1. 使用 LLaMA-Factory 实现对大模型函数调用功能

    2024-06-09 07:50:05       30 阅读
  2. 二叉树----7-3 列出叶结点

    2024-06-09 07:50:05       24 阅读
  3. bat指令踩坑记录

    2024-06-09 07:50:05       29 阅读
  4. Web Dart前端:探索、挑战与未来展望

    2024-06-09 07:50:05       34 阅读
  5. 计算机视觉中的low-level与 high-level任务

    2024-06-09 07:50:05       37 阅读
  6. python记录之字符串

    2024-06-09 07:50:05       40 阅读