AI网络爬虫019:搜狗图片的时间戳反爬虫应对策略

一、介绍

如何批量爬取下载搜狗图片搜索结果页面的图片?以孙允珠这个关键词的搜索结果为例:

https://pic.sogou.com/pics?

在这里插入图片描述

翻页规律如下:

https://pic.sogou.com/napi/pc/searchList?mode=2&start=384&xml_len=48&query=%E5%AD%99%E5%85%81%E7%8F%A0&channel=pc_pic

https://pic.sogou.com/napi/pc/searchList?mode=2&start=336&xml_len=48&query=%E5%AD%99%E5%85%81%E7%8F%A0&channel=pc_pic

https://pic.sogou.com/napi/pc/searchList?mode=2&start=288&xml_len=48&query=%E5%AD%99%E5%85%81%E7%8F%A0&channel=pc_pic

这三个URL都指向同一个服务,即搜狗图片搜索的API,用于获取孙允珠相关的图片搜索结果。它们之间的规律主要体现在查询参数 startxml_len 上:

*

相关推荐

  1. Symfony DomCrawler库在爬虫应用

    2024-07-12 02:20:04       28 阅读
  2. AI发展中伦理挑战与策略

    2024-07-12 02:20:04       23 阅读
  3. 企业面临网络安全风险及策略

    2024-07-12 02:20:04       42 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-07-12 02:20:04       66 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-07-12 02:20:04       70 阅读
  3. 在Django里面运行非项目文件

    2024-07-12 02:20:04       57 阅读
  4. Python语言-面向对象

    2024-07-12 02:20:04       68 阅读

热门阅读

  1. 在conda虚拟环境中安装llama-parse依赖

    2024-07-12 02:20:04       20 阅读
  2. Sugon RackServer服务器监控指标解读

    2024-07-12 02:20:04       27 阅读
  3. 区块链技术的应用场景和优势。

    2024-07-12 02:20:04       22 阅读
  4. 笔记第二弹

    2024-07-12 02:20:04       26 阅读
  5. 小程序 全局数据共享 getApp()

    2024-07-12 02:20:04       21 阅读
  6. 算法·二分

    2024-07-12 02:20:04       17 阅读
  7. 解决AssertionError: Negative indexing is not supported

    2024-07-12 02:20:04       23 阅读