用不同的url头利用Python访问一个网站,把返回的东西保存为txt文件

这个需要调用requests模块(相当于c++的头文件)

import requests 

 还需要一个User-Agent头(这个意思就是告诉python用的什么系统和浏览器)

Google Chrome(Windows):

Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.82 Safari/537.36

Mozilla Firefox(Windows):

Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:86.0) Gecko/20100101 Firefox/86.

Microsoft Edge(Windows):

Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.774.63 Safari/537.36 Edg/89.0.774.63

这仨是常用的,谷歌 火狐  Edge, 我这里使用的是edge 

headers_list =  {'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.774.63 Safari/537.36 Edg/89.0.774.63'}

 找到网页后就可以扒内容了

with open('response.txt', 'w', encoding='utf-8') as file:  

    for headers in headers:  

        # 发送请求  

        response = requests.get(url, headers=headers)  

        # 打印状态码  

        print(f'Sent request with header: {headers["User-Agent"]}, Status code: {response.status_code}')  

        # 如果请求成功,保存返回内容  

        if response.status_code == 200:  

            file.write(f'Response with header: {headers["User-Agent"]}\n')  

            file.write(response.text )  

        else:  

            file.write(f'Failed request with header: {headers["User-Agent"]}, Status code: {response.status_code}')  

print('请求成功!')

完整代码如下

import requests  

# 定义要访问的URL  
url = 'http://baidu.com'  # 请替换为你要访问的网站  

# 定义User-Agent头  
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/126.0.0.0 Safari/537.36 Edg/126.0.0.0',
}
# 创建一个TXT文件来保存返回的内容  
with open('response.txt', 'w', encoding='utf-8') as file:  
    for headers in headers:  
        # 发送请求  
        response = requests.get(url, headers=headers)  
        
        # 打印状态码  
        print(f'Sent request with header: {headers["User-Agent"]}, Status code: {response.status_code}')  
        
        # 如果请求成功,保存返回内容  
        if response.status_code == 200:  
            file.write(f'Response with header: {headers["User-Agent"]}\n')  
            file.write(response.text)  
        else:  
            file.write(f'Failed request with header: {headers["User-Agent"]}, Status code: {response.status_code}')  

print('请求成功!')  

 结果如下

 

 文本如下

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-07-21 18:22:02       52 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-07-21 18:22:02       54 阅读
  3. 在Django里面运行非项目文件

    2024-07-21 18:22:02       45 阅读
  4. Python语言-面向对象

    2024-07-21 18:22:02       55 阅读

热门阅读

  1. Leetcode热题100 Day3

    2024-07-21 18:22:02       13 阅读
  2. SQL Server查询计划阅读及分析

    2024-07-21 18:22:02       15 阅读
  3. 【整理了一些关于使用swoole使用的解决方案】

    2024-07-21 18:22:02       15 阅读
  4. Vue中如何封装接口

    2024-07-21 18:22:02       18 阅读
  5. happens-before

    2024-07-21 18:22:02       14 阅读
  6. 如何实现宝塔面板免手机号登录?

    2024-07-21 18:22:02       17 阅读
  7. 自动化炒股:券商交易接口API调用方法

    2024-07-21 18:22:02       18 阅读
  8. Redis的过期删除策略与内存淘汰机制

    2024-07-21 18:22:02       20 阅读
  9. vivado INTERNAL_VREF

    2024-07-21 18:22:02       16 阅读
  10. 商品价格中也有“歧视”

    2024-07-21 18:22:02       14 阅读
  11. Unity3D UGUI适配不同分辨率详解

    2024-07-21 18:22:02       16 阅读
  12. 【Flask项目】文件分享系统(二)

    2024-07-21 18:22:02       16 阅读
  13. Spring框架中的设计模式:深入剖析

    2024-07-21 18:22:02       16 阅读
  14. 小程序发布流程?

    2024-07-21 18:22:02       12 阅读