用python实现提取word中的所有图片

你可以使用python-docx库来处理word文件,然后遍历文件中的所有形状,找到图片。

首先,你需要安装python-docx库。在命令行中输入以下命令进行安装:


  

复制代码

pip install python-docx

然后,你可以使用以下代码提取word文件中的所有图片:


  

python复制代码

from docx import Document
from docx.shared import Inches
def extract_images(filename):
# 加载word文件
doc = Document(filename)
# 存储图片路径的列表
image_paths = []
# 遍历文件中的所有形状
for shape in doc.shapes:
# 如果形状是图片,则添加到列表中
if shape.has_image:
image_paths.append(shape.image.filename)
return image_paths

这个函数会返回一个列表,其中包含word文件中所有图片的路径。

请注意,这个函数只能提取word文件中嵌入的图片,无法提取链接的图片。如果你需要提取链接的图片,你可能需要使用更复杂的工具或库,如python-docx的高级版python-docx-image-to-data。

相关推荐

  1. python实现提取word所有图片

    2024-01-09 20:12:03       39 阅读
  2. python实现word所有图片变清晰

    2024-01-09 20:12:03       37 阅读
  3. python替换word文件图片

    2024-01-09 20:12:03       6 阅读
  4. Python和VBA批量提取Word表格

    2024-01-09 20:12:03       32 阅读
  5. python如何提取html所有中文

    2024-01-09 20:12:03       10 阅读

最近更新

  1. TCP协议是安全的吗?

    2024-01-09 20:12:03       18 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-01-09 20:12:03       19 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-01-09 20:12:03       18 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-01-09 20:12:03       20 阅读

热门阅读

  1. CentOS7安装Neo4j

    2024-01-09 20:12:03       45 阅读
  2. unity中 canvas下物体的朝向跟随

    2024-01-09 20:12:03       40 阅读
  3. C与C++队列实现

    2024-01-09 20:12:03       37 阅读
  4. Zookeeper集群+Kafka集群

    2024-01-09 20:12:03       36 阅读
  5. okhttpclient.setsslsocketfactory 报错解决

    2024-01-09 20:12:03       41 阅读
  6. 「 PyMuPDF专栏 」PyMuPDF为PDF文件添加注释

    2024-01-09 20:12:03       33 阅读
  7. 彻底卸载Microsoft Edge的几种方法

    2024-01-09 20:12:03       35 阅读
  8. Docker 的基本概念和优势

    2024-01-09 20:12:03       30 阅读
  9. PHP 完整表单实例

    2024-01-09 20:12:03       29 阅读
  10. leetcode09-机器人能否返回原点

    2024-01-09 20:12:03       44 阅读
  11. LeetCode 447. 回旋镖的数量,枚举+哈哈希

    2024-01-09 20:12:03       45 阅读
  12. leetcode07-罗马数字的转换

    2024-01-09 20:12:03       44 阅读
  13. Qt基础-容器类详解

    2024-01-09 20:12:03       40 阅读