用kimichat批量识别出图片版PDF文件中的文字内容

图片版的PDF文件,怎么才能借助AI工具来提取其中全部的文字内容呢?

第一步:将PDF文件转换成图片格式

具体方法参见文章:《零代码编程:用kimichat将图片版PDF自动批量分割成多个图片》

第二步:识别图片中的文字

将第一步pdf转换成的图片,上传到kimichat

注意:kimichat目前上传图片一次最多50张图片,单个大小不超过100M

上传完成后,kimichat会进行解析。

部分图片会提示:未提取到文字或者解析失败

点击这些解析失败图片的右上角红色X,把这些无法解析的图片删除掉

然后回车,就全部识别出来到了。但是,识别的顺序不是按照文件标题名来的,有些乱,可以让kimichat调整下:

请按照图片标题顺序排列

Kimichat最终的输出结果:

当然,根据您提供的图片标题顺序,这里是整理后的文字内容:

  1. **page_5.png:**
    - I'll Be α
    - COWBOY
    - Anita Bijsterbosch
    - Clavis
    - NEWYORK
  2. **page_6.png:**
    - “Mommy, there's a party at school
    - tomorrow, and we get to wear
    - costumes!" Sammy says.
  3. **page_8.png:**
    - "I think I'll be
    - a cowboy.
    - lasso"
  4. **page_9.png:**
    - cowboyhat
    - Shirt .........
    - vest
    - ....
    - Fringed pants
    - cowboy boots
    - spurs
  5. **page_10.png:**
    - "Yee-Haw!"
  6. **page_12.png:**
    - "Or wait, I'll go as
    - a firefighter."
    - dragon
    - walkie-talkie
    - Fire engine
    - Flashlight
  7. **page_13.png:**
    - helmet
    - Firefighter suit
    - gloves
    - Firefighter boots
  8. **page_15.png:**
    - "Fire!"
  9. **page_16.png:**
    - "Hmm, perhaps
    - I'll be a pirate."
    - parrot
    - JollyRoger
    - treasure map
    - treasure chest
    - spyglass
  10. **page_17.png:**
    - bandana
    - eyepatch
    - striped T-shirt
    - ......
    - belt
    - trousers
    - buccaneer
    - boots
  11. **page_19.png:**
    - Land
    - ho!"
  12. **page_20.png:**
    - “Or I could
    - gc
    - as a knight.
    - castle
    - horse
    - cuddly toy
    - Feather
    - dragon
    - Sword”
  13. **page_21.png:**
    - helmet
    - armor
    - shield
    - gauntlet
    - boots
  14. **page_23.png:**
    - Tan-tan-tara!
  15. **page_24.png:**
    - "I could be
    - a magician...
    - wand"
  16. **page_25.png:**
    - magic hat
    - OD
    - boots
  17. **page_26.png:**
    - "+"
  18. **page_27.png:**
    - Abracadabra!
  19. **page_28.png:**
    - “Or maybe
    - I should
    - just go
    - as myself?”
  20. **page_29.png:**

- T-shirt

- overalls

- boots

这些文字内容似乎是从一本关于职业和角色扮演的儿童书中提取的。如果您需要进一步的信息或帮助,请随时联系我。

最近更新

  1. TCP协议是安全的吗?

    2024-04-05 17:36:01       18 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-04-05 17:36:01       19 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-04-05 17:36:01       18 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-04-05 17:36:01       20 阅读

热门阅读

  1. 蓝桥杯B组C++省赛——飞机降落(DFS)

    2024-04-05 17:36:01       14 阅读
  2. 算法刷题day39:树形DP

    2024-04-05 17:36:01       11 阅读
  3. 安卓手机APP开发的安卓工作台的简介

    2024-04-05 17:36:01       16 阅读
  4. 数据结构(无图版)

    2024-04-05 17:36:01       17 阅读
  5. 云之道知识付费系统搭建教程

    2024-04-05 17:36:01       16 阅读
  6. 力扣贪心算法--第三天

    2024-04-05 17:36:01       16 阅读
  7. 为什么android创建Fragment推荐用newInstance

    2024-04-05 17:36:01       16 阅读
  8. 03-Docker入门

    2024-04-05 17:36:01       14 阅读