python 爬虫爬取知乎LOL图片(亲测)

获取信息

访问url后按f12调试

点击network

定位图片信息:

可以看到,每个图片的名字和下载地址在标红处,示例如下:

data-actualsrc=“https://pic4.zhimg.com/v2-1681ff26afbd5f92aa5790b4dee6a63f_b.jpg

现在就是requests访问url,然后使用re正则去匹配到所有这个data-actualsrc的url

然后使用for循环批量下载这个url到本地

代码

import re
import os
import requests
url = 'https://zhuanlan.zhihu.com/p/664329877'
headers = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/122.0.0.0 Safari/537.36'}
response = requests.get(url, headers=headers)
response.encoding = "utf-8"
# print(response.text)
parser = re.compile('data-actualsrc="(https://pic4.*?)"')
image_urls = re.findall(parser, response.text)
for image_url in image_urls:
    # print(image_url)
    image_name = image_url.split('/')[-1]
    print(f"downloading image:{image_name}")
    image_response = requests.get(image_url)
    if image_response.status_code == 200:
        with open (image_name, 'wb') as f:
            f.write(image_response.content)
        print("success")
    else:
        print("failed")
print("yes")

返回

图片都下载到了当前项目的同级目录下

这个案例print输出也是简单的,就对付一下。 

下载的路径建议使用os模块去创建个单独的目录,将图片杜下载到指定目录里

相关推荐

  1. python爬虫图片网页实例

    2024-03-14 01:06:01       25 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-03-14 01:06:01       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-03-14 01:06:01       100 阅读
  3. 在Django里面运行非项目文件

    2024-03-14 01:06:01       82 阅读
  4. Python语言-面向对象

    2024-03-14 01:06:01       91 阅读

热门阅读

  1. 哈希冲突

    2024-03-14 01:06:01       43 阅读
  2. 函数式编程之参数

    2024-03-14 01:06:01       39 阅读
  3. 453453

    2024-03-14 01:06:01       41 阅读
  4. android pdf框架-7,白边切割

    2024-03-14 01:06:01       41 阅读
  5. 贪心算法|【简介】

    2024-03-14 01:06:01       37 阅读
  6. SSL证书的定义

    2024-03-14 01:06:01       45 阅读
  7. LJXpaper

    LJXpaper

    2024-03-14 01:06:01      40 阅读
  8. 传统开发读写优化与HBase

    2024-03-14 01:06:01       43 阅读
  9. MYSQL集群

    2024-03-14 01:06:01       35 阅读
  10. 翻硬币..

    2024-03-14 01:06:01       48 阅读
  11. vue element plus Select 选择器

    2024-03-14 01:06:01       37 阅读
  12. 计算机等级考试:信息安全技术 知识点八

    2024-03-14 01:06:01       42 阅读
  13. window安装Docker

    2024-03-14 01:06:01       45 阅读