王者荣耀爬虫程序

2024-07-12 18:42:04
开发
21

"""
文档注释： 三引号 出现在文件开头
爬虫流程：1.请求 2.解析 3.保存
1. 需要找到请求地址（F12 调试工具 网络页签 刷新 搜索 查找）
url = "https://pvp.qq.com/web201605/js/herolist.json"
需要使用请求工具 urllib 包 （python 内置的请求工具）
2. 解析（遍历 提取目标数据）
3. 保存
"""

# 从urllib 包下导入 request请求工具
from urllib import request
# 导入 数据转换模块
import json

# 请求一个网址 将返回内容存入response响应对象
response = request.urlopen("https://pvp.qq.com/web201605/js/herolist.json")
# 读取结果 解码utf8 将最终内容放入response
response = response.read().decode("utf8")
# 将字符串response  转换为方便使用的对象
response = json.loads(response)
# 使用for遍历response
for data in response:
    # 解析中文名 和头像地址
    head_url = f'https://game.gtimg.cn/images/yxzj/img201606/heroimg/{data["ename"]}/{data["ename"]}.jpg'
    cname = data["cname"]
    # print(cname, head_url)
    # 向头像地址 再次发起请求
    head_response = request.urlopen(head_url)
    head_response = head_response.read()
    # 将返回的头像数据保存到文件
    file = open(f"./heads/{cname}.jpg", "wb")
    file.write(head_response)
    file.close()
    print(f"保存 {cname} 成功")

原文地址:https://blog.csdn.net/zhangzhaoyuxunlei/article/details/140385974 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1811712622911950848.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部

王者荣耀爬虫程序

相关推荐

最近更新

热门阅读