在Linux系统中搜索当前路径及其子目录下所有PDF文件中是否包含特定字符串


在这里插入图片描述

方法一:pdfgrep

pdfgrep -ri "rockchip" .

方法二:使用findxargspdftotext(将PDF转换为文本)组合,然后用grep搜索

这里是一个示例命令,显示了如何将这些工具组合起来搜索字符串"rockchip":

find . -name "*.pdf" -exec sh -c 'pdftotext "{}" - | grep -H --label="{}" "rockchip"' \;

这条命令将:

  • 使用find命令在当前目录及子目录中查找所有扩展名为.pdf的文件。
  • 对每个找到的PDF文件,执行sh -c启动一个新的shell来处理以下命令:
    • 使用pdftotext将PDF文件转换为文本并将结果直接传递给grep
    • 使用grep搜索"rockchip"字符串,其中-H选项会打印文件名,--label会确保在输出中使用原始的PDF文件名,即使文本是通过管道传递的。

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-04-23 11:06:02       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-04-23 11:06:02       101 阅读
  3. 在Django里面运行非项目文件

    2024-04-23 11:06:02       82 阅读
  4. Python语言-面向对象

    2024-04-23 11:06:02       91 阅读

热门阅读

  1. 小米消金深耕科技金融,引领金融服务创新体验

    2024-04-23 11:06:02       33 阅读
  2. 【微软押注ARM架构,“Wintel”联盟摇摇欲坠?】

    2024-04-23 11:06:02       37 阅读
  3. 迭代加深搜索

    2024-04-23 11:06:02       37 阅读
  4. 用爬虫玩转石墨文档

    2024-04-23 11:06:02       38 阅读
  5. PDD爬虫工具分享 采集拼多多商家联系方式的工具

    2024-04-23 11:06:02       28 阅读
  6. LINUX固定USB设备名称

    2024-04-23 11:06:02       32 阅读
  7. 20240423信息爆炸的时代,我们为什么还要读书?

    2024-04-23 11:06:02       37 阅读