Python 识别图片形式pdf的尝试(未解决)

想识别出pdf页面右下角某处的编号。pdf是图片形式页面。查了下方法,有源码是先将页面提取成jpg,再用pytesseract提取图片文件中的内容。

直接用图片来识别。纯数字的图片,如条形码,可识别。带中文的不可以,很乱。

识别为:

如何形成wps图片中的文字识别效果呢?

import pytesseract
from PIL import Image

def extract_text_from_image(image_path):
    image = Image.open(image_path)
    text = pytesseract.image_to_string(image)
    return text

image_path = r"D:\11.png"
text = extract_text_from_image(image_path)
print(f"图片内容:\n{text}\n")

 

相关推荐

  1. Python PDF转换为图片解决方案

    2024-06-07 01:30:02       73 阅读
  2. Python PDF转换为图片解决方案

    2024-06-07 01:30:02       59 阅读
  3. pdf图片识别分类

    2024-06-07 01:30:02       31 阅读
  4. 实现将信息作为txt,pdf,图片形式保存到电脑~

    2024-06-07 01:30:02       50 阅读
  5. 基于OpenCV图像颜色与形状识别原理

    2024-06-07 01:30:02       58 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-06-07 01:30:02       98 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-06-07 01:30:02       106 阅读
  3. 在Django里面运行非项目文件

    2024-06-07 01:30:02       87 阅读
  4. Python语言-面向对象

    2024-06-07 01:30:02       96 阅读

热门阅读

  1. WEB三大主流框架之Vue.js

    2024-06-07 01:30:02       27 阅读
  2. 黑马es数据同步mq解决方案

    2024-06-07 01:30:02       21 阅读
  3. 如何快速入门使用Vue.js

    2024-06-07 01:30:02       32 阅读
  4. 在Linux/Ubuntu/Debian系统中使用 `tar` 压缩文件

    2024-06-07 01:30:02       26 阅读
  5. Attention as an RNN

    2024-06-07 01:30:02       29 阅读
  6. 【C++】C++程序的四个区和智能指针的实现

    2024-06-07 01:30:02       34 阅读
  7. AWS需要实名吗?

    2024-06-07 01:30:02       28 阅读