OCR常用识别算法综述

参考:https://aistudio.baidu.com/education/lessonvideo/3279888

语种:常用字符36与常用汉字6623,区别。
标注:文本型位置/单字符位置,后者标注成本大
挑战:场景文字识别:字符大小、颜色、字体、亮度、对比度多样。文字模糊、排列不规则、文字残缺、遮挡
发展历程:两个阶段2015年前,后

在这里插入图片描述
数据集:

Synth90k,Synth Text
在这里插入图片描述
水平文本
在这里插入图片描述
(最后一个基本不用上)

在这里插入图片描述
在这里插入图片描述
识别方法:
在这里插入图片描述
传统方法:

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
GTC
在这里插入图片描述
在这里插入图片描述
文本不规则解决
在这里插入图片描述
在这里插入图片描述
TextScanner
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
NRTR
自注意力模型:
更适合长文本识别
在这里插入图片描述
SAR
1D变2D效果更好

在这里插入图片描述
语言信息、对其信息、视觉信息都有用上,就是会更慢一点

在这里插入图片描述
RobustScanner

在这里插入图片描述
在这里插入图片描述
CDistNet

在这里插入图片描述
在这里插入图片描述
并行注意力解码

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
visionLAN
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

小结:
在这里插入图片描述

相关推荐

  1. Ocr识别

    2024-04-05 17:52:06       31 阅读
  2. 入门算法

    2024-04-05 17:52:06       61 阅读
  3. STL——算法

    2024-04-05 17:52:06       37 阅读
  4. 算法

    2024-04-05 17:52:06       31 阅读
  5. STL - 算法

    2024-04-05 17:52:06       20 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-04-05 17:52:06       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-04-05 17:52:06       100 阅读
  3. 在Django里面运行非项目文件

    2024-04-05 17:52:06       82 阅读
  4. Python语言-面向对象

    2024-04-05 17:52:06       91 阅读

热门阅读

  1. 1.Swift基础控件:TableView列表

    2024-04-05 17:52:06       36 阅读
  2. Python数据分析与挖掘

    2024-04-05 17:52:06       41 阅读
  3. Linux C++ 019-多态

    2024-04-05 17:52:06       29 阅读
  4. 在国企特定的环境中,如何激励低效能员工?

    2024-04-05 17:52:06       36 阅读
  5. 梦想编码:0基础解锁IT世界的无限可能

    2024-04-05 17:52:06       37 阅读
  6. 密码学基础古典密码

    2024-04-05 17:52:06       37 阅读
  7. 用O(1)时间复杂度实现bitset()函数

    2024-04-05 17:52:06       37 阅读
  8. ChatGPT:学术论文写作的秘密武器

    2024-04-05 17:52:06       42 阅读
  9. 蓝桥杯B组C++省赛——飞机降落(DFS)

    2024-04-05 17:52:06       29 阅读
  10. 算法刷题day39:树形DP

    2024-04-05 17:52:06       25 阅读
  11. 安卓手机APP开发的安卓工作台的简介

    2024-04-05 17:52:06       36 阅读