【爬虫专区】批量下载PDF (无反爬)

天命:只要没反爬,一切都简单

这次爬取的是绿盟的威胁情报的PDF

先看一下结构,很明显就是一个for循环渲染

burp抓包会发现第二次接口请求

接口请求一次就能获取到了所有的数据

然后一个循环批量下载数据即可,其实没啥难度的

import requests,os

res = requests.get("https://nti.nsfocus.com/api/v2/report/notie/?page=1&size=200&order=reported")
data_dict = res.json() # 提取json格式
当前相对路径 = os.getcwd()  # 获取绝对路径,每个人电脑不一样,所以预算是相对路径
os.mkdir("PDF") # 在当前文件夹下,创建一个PDF文件夹

# 提取data字段
data = data_dict['data']
for 数据 in data:
    日期 = 数据['created']
    日期 = 日期.split("T")[0]
    标题 = 数据['title']
    文件名 =

相关推荐

  1. Python爬虫-批量取免费小说并下载保存到本地

    2024-01-31 21:18:03       117 阅读
  2. python爬虫04-常见

    2024-01-31 21:18:03       55 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-01-31 21:18:03       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-01-31 21:18:03       100 阅读
  3. 在Django里面运行非项目文件

    2024-01-31 21:18:03       82 阅读
  4. Python语言-面向对象

    2024-01-31 21:18:03       91 阅读

热门阅读

  1. MATLAB中conv和filter函数的区别

    2024-01-31 21:18:03       53 阅读
  2. c++cout解释

    2024-01-31 21:18:03       56 阅读
  3. 国内外FPGA主要厂商和其主要芯片

    2024-01-31 21:18:03       48 阅读
  4. 【搜索术】代码阅读理解学习学习笔记

    2024-01-31 21:18:03       49 阅读