Python爬虫:设置随机 User-Agent

 Python爬虫:设置随机 User-Agent

在Python中编写爬虫时,为了模拟真实用户的行为并防止被服务器识别为爬虫,通常需要设置随机的User-Agent。你可以使用fake-useragent库来实现这一功能。首先,你需要安装fake-useragent库:

pip install fake-useragent

image.gif

然后,你可以按照以下示例代码来设置随机User-Agent:

import requests
from fake_useragent import UserAgent
def get_random_user_agent():
    ua = UserAgent()
    return ua.random
def crawl_url(url):
    headers = {'User-Agent': get_random_user_agent()}
    response = requests.get(url, headers=headers)
    if response.status_code == 200:
        return response.text
    else:
        print("Failed to fetch URL:", response.status_code)
if __name__ == "__main__":
    url = "https://example.com"  # 要爬取的网址
    html_content = crawl_url(url)
    print(html_content)  # 输出网页内容

image.gif

image

image.gif

编辑

这个示例中,get_random_user_agent() 函数使用fake-useragent库来获取一个随机的User-Agent字符串,并将其用于构造请求头。然后,crawl_url() 函数发送带有随机User-Agent的HTTP请求,并返回网页内容。

记得在使用爬虫时,要尊重网站的robots.txt文件,以避免访问被禁止的页面。同时,避免发送过于频繁的请求,以免对服务器造成负担。

相关推荐

  1. Scrapy设置随机User-Agent

    2024-03-11 22:14:01       32 阅读
  2. 爬虫】在Scrapy中配置随机User-Agent中间件

    2024-03-11 22:14:01       89 阅读
  3. 爬虫User-Agent爬虫

    2024-03-11 22:14:01       44 阅读
  4. header中的User-agent

    2024-03-11 22:14:01       53 阅读
  5. uniapp webview 修改ua(UserAgent、user-agent

    2024-03-11 22:14:01       47 阅读
  6. Chrome查看User Agent的实战教程

    2024-03-11 22:14:01       34 阅读
  7. SEO:搜索引擎蜘蛛名称UA(user-agent

    2024-03-11 22:14:01       37 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-03-11 22:14:01       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-03-11 22:14:01       101 阅读
  3. 在Django里面运行非项目文件

    2024-03-11 22:14:01       82 阅读
  4. Python语言-面向对象

    2024-03-11 22:14:01       91 阅读

热门阅读

  1. 设计模式之依赖倒转原则

    2024-03-11 22:14:01       42 阅读
  2. 几行代码帮你搞懂C#中的协变与逆变

    2024-03-11 22:14:01       40 阅读
  3. mysql笔记:12. 数据备份与还原

    2024-03-11 22:14:01       44 阅读
  4. c++中static的作用

    2024-03-11 22:14:01       35 阅读
  5. 【C++】6-10 输出最大值 分数 10

    2024-03-11 22:14:01       41 阅读
  6. VoIP之音视频质量及弱网解决方案

    2024-03-11 22:14:01       51 阅读
  7. 通过Jenkins自动化部署net core 项目

    2024-03-11 22:14:01       44 阅读
  8. 计算机网络面经-拥塞控制的乘法减小和加法增大

    2024-03-11 22:14:01       47 阅读
  9. springboot项目集成Redis,使用redis各项功能

    2024-03-11 22:14:01       48 阅读
  10. 什么是IoC和AOP?

    2024-03-11 22:14:01       49 阅读
  11. macos系统中redis如何设置密码

    2024-03-11 22:14:01       48 阅读
  12. 为什么农村大学生大多混的很差

    2024-03-11 22:14:01       37 阅读
  13. WPF —— TextBox 控件详解

    2024-03-11 22:14:01       43 阅读
  14. c++ primer中文版第五版作业第十三章

    2024-03-11 22:14:01       34 阅读