爬虫框架比较:Selenium vs. Pyppeteer vs. Playwright vs. Luna抗指纹框架- 爬虫框架对比及排名

​ 这篇文章将对比四种爬虫框架:Selenium、Pyppeteer、Playwright和Luna抗指纹框架。我们将重点介绍Luna,它是专门设计用于绕过网站反爬机制的工具,提供了一系列功能来模拟真实用户行为以避免被检测。通过本文的比较和排名,读者可以选择最适合其需求的爬虫框架。

原框架项目址:https://github.com/musiclover789/luna_python

目前有golang 和python 两个版本

import time

import devtools.browser as luna
import devtools.page as page
import common.server_management as init

"""
测试目的:希望你可以正常使用指纹
"""


def main():
    """
    start函数是启动 服务、你可以选择传入参数;就是端口号、你也可以不传入、如果你不传入 程序会自动选择一个未被占用的端口。
    如果你不清楚他有什么用、可以不予理睬
    """
    if not init.start(9876):
        print("启动服务-失败")

    """
        chromium_path 是必须要传入的参数、就是你抗指纹浏览器所在的路径 如 c:\\luna\\Default\\chrome.exe
    """
    chromium_path = "/Users/hongyuji/Documents/workspace/golang/Chromium.app/Contents/MacOS/Chromium"

    args = [
        "--luna_cavans_random_str=B3B4",
        "--luna_user_agent=Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.107 Safari/537.36",
        "--luna_platform=win64",
        "--luna_languages=en-GB",
        "--luna_deviceMemory=8",
        "--luna_UNMASKED_VENDOR_WEBGL=Intel Corporation",
        "--luna_UNMASKED_RENDERER_WEBGL=Intel(R) UHD Graphics 620",
        "--luna_GL_VERSION=WebGL 1.0 (OpenGL ES 3.0 Intel(R) UHD Graphics 620)",
        # 仅是示例、更多指纹设置参考luna golang版本文档-都是一样的
    ]  # 示例指纹列表,

    chrome_id = luna.new_browser(chromium_path, fingerprint=args)

    time.sleep(1)

    page_id = page.open_page(chrome_id, "http://www.baidu.com")

    print("便于您查看指纹、暂停1分钟")
    time.sleep(60)

    page.close_page(page_id)
    # 关闭浏览器
    print("关闭浏览器", luna.close_browser(chrome_id))


if __name__ == "__main__":
    main()

相关推荐

  1. 爬虫框架Scrapy

    2024-04-14 07:56:04       53 阅读
  2. 爬虫框架Beautiful Soup

    2024-04-14 07:56:04       52 阅读
  3. 爬虫框架Beautiful Soup

    2024-04-14 07:56:04       54 阅读
  4. 爬虫框架beautifulsoup详解

    2024-04-14 07:56:04       50 阅读
  5. 手写爬虫框架

    2024-04-14 07:56:04       69 阅读
  6. python爬虫框架Scrapy

    2024-04-14 07:56:04       62 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-04-14 07:56:04       98 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-04-14 07:56:04       106 阅读
  3. 在Django里面运行非项目文件

    2024-04-14 07:56:04       87 阅读
  4. Python语言-面向对象

    2024-04-14 07:56:04       96 阅读

热门阅读

  1. insert statements with append hint in archive log

    2024-04-14 07:56:04       34 阅读
  2. 设计模式(018)行为型之策略模式

    2024-04-14 07:56:04       119 阅读
  3. cocos2dx4.0 vs编译报错

    2024-04-14 07:56:04       40 阅读
  4. ubuntu netplan 设置dns

    2024-04-14 07:56:04       125 阅读
  5. 自动化word导出

    2024-04-14 07:56:04       35 阅读
  6. 每天学习一个Linux命令之w

    2024-04-14 07:56:04       37 阅读
  7. array和vector

    2024-04-14 07:56:04       115 阅读
  8. mybatis-plus实现数据字段加解密

    2024-04-14 07:56:04       36 阅读
  9. HTML VUE

    2024-04-14 07:56:04       36 阅读
  10. 查询电脑用户名和组信息

    2024-04-14 07:56:04       34 阅读
  11. Python数据库编程实战:sqlite3模块详解

    2024-04-14 07:56:04       42 阅读