解决selenium加载网页过慢影响程序运行时间的问题

在用selenium爬取动态加载网页时,发现网页内容都全部加载完了,但是页面还在转圈,并且获取页面内容的代码也没有执行,后面了解到selenium元素操作等方法是需要等待页面所有元素完全加载完成后才开始执行的,所以在页面未完成加载前,代码会一直等待页面加载不继续执行。

解决方法

设置页面加载时间,到了点就通过异常处理的方式让页面加载停止。超过设置的加载时间就会报错,然后捕获异常让页面停止加载

import time
from selenium import webdriver
 
start = time.time()
 
driver = webdriver.Chrome()
# 设置页面加载时间
driver.set_page_load_timeout(5)
 
try:
    driver.get('https://search.damai.cn/search.html?keyword=111&spm=a2oeg.home.searchtxt.dsearchbtn')
except:
    # 超时后执行Javascript停止页面加载
    driver.execute_script('window.stop()')
 
end = time.time()
# 计算页面加载时间
print(end - start)
 
 
>>>6.229357481002808

设置加载策略,设置加载策略为eager

import time
from selenium import webdriver
 
start = time.time()
 
options = webdriver.ChromeOptions()
# 设置加载策略为eager
options.page_load_strategy = 'eager'
driver = webdriver.Chrome(options=options)
driver.get('https://search.damai.cn/search.html?keyword=111&spm=a2oeg.home.searchtxt.dsearchbtn')
 
end = time.time()
# 计算页面加载时间
print(end - start)
 
 
>>>1.859546184539795

通过这2步可以大大提升速度。之前我加载页面一个就要42s,效率很低。改完以后刷刷滴

相关推荐

  1. 【arxiv解决方法】

    2024-06-06 14:52:09       35 阅读
  2. 解决Qt在线安装问题

    2024-06-06 14:52:09       11 阅读
  3. 解决spa页面首屏方式笔记

    2024-06-06 14:52:09       43 阅读

最近更新

  1. TCP协议是安全的吗?

    2024-06-06 14:52:09       18 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-06-06 14:52:09       19 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-06-06 14:52:09       18 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-06-06 14:52:09       20 阅读

热门阅读

  1. MQ基础(RabbitMQ)

    2024-06-06 14:52:09       8 阅读
  2. Linux系统编程之进程间通信(IPC)

    2024-06-06 14:52:09       10 阅读
  3. websocket链接携带参数

    2024-06-06 14:52:09       9 阅读
  4. EVO轨迹评估工具基本使用教程(学习记录)

    2024-06-06 14:52:09       12 阅读
  5. Selenium自动化测试入门:cookie 处理

    2024-06-06 14:52:09       9 阅读
  6. Python库之pandas的高级用法深度解析

    2024-06-06 14:52:09       10 阅读
  7. ubuntu上zsh与bash切换

    2024-06-06 14:52:09       10 阅读
  8. Mac上搭建Python环境:深入探索与高效实践

    2024-06-06 14:52:09       9 阅读
  9. C++函数模版和C#的泛型函数的区别

    2024-06-06 14:52:09       8 阅读
  10. vue 权限分组

    2024-06-06 14:52:09       8 阅读
  11. gin-vue-admin整合 ElasticSearch

    2024-06-06 14:52:09       10 阅读