Python-web自动化-Playwright的学习

在这里插入图片描述

1. 安装playwright

pip命令

pip install playwright

之后还需要安装对应浏览器的驱动程序,使用命令

playwright install chromium

这是谷歌浏览器的驱动程序的下载
下面这是一段playwright-web自动化实例代码

from playwright.sync_api import sync_playwright


p = sync_playwright().start()
# 启动playwrite driver进程
browser = p.chromium.launch(headless=False)
# 驱动谷歌浏览器 启动浏览器
# headless = False 有界面的

page = browser.new_page()
# 创建新页面
page.goto(url='https://www.baidu.com')

page.locator('#kw').fill('科技')
# 定位输入框 输入科技
page.locator('#su').click()
# 点击搜索
# 关闭浏览器
browser.close()
# 关闭进程
p.stop()
2. 界面等待

不推荐使用time.sleep方法进行界面等待
因为playwright底层使用的是异步的python库进行各种事件处理,time.sleep会破坏异步框架的处理逻辑。
使用page对象的wait_for_timeout方法达到等待效果,单位为毫秒

page.wait_for_timeout(2000)
3. 自动化代码助手

输入命令

playwright codegen

相当于selenium中的selenium ide脚本录制工具
在这里插入图片描述

4. 定位元素
1. css selector定位

使用Locator类型的对象来进行定位元素,比如上述代码中

page.locator('#kw').fill('科技')
# 定位输入框 输入科技
page.locator('#su').click()
# 点击搜索

locator()就是,之后的fill、click属于元素操作,可以根据tag名、id、class选择元素,这种定位方式如果有一些html/css基础的,应该在定位元素方面基本没有问题,因为这个定位元素的表达式和css样式元素定位基本差不多的。
请添加图片描述

2. xpath定位

上述代码可以修改为:

page.locator('//input[@id="kw"]').fill('科技')
# 定位输入框 输入科技
page.locator('//input[@id="su"]').click()
# 点击搜索

有一定xpath基础绝对是没有问题的

3. get_by_XXX定位

在这里插入图片描述
get_attribute只是获取对应元素的某个属性值

5. 操作元素

1.click,点击元素(单击)、dblclick(双击元素)
2. fill,输入文本,clear,清空文本框中的内容,input_value,获取文本框中的内容
3. inner_text,获取元素内部文本
4. all_inner_texts,获取所有匹配的文本
5. text_centent、all_text_contents,和inner_text、all_inner_texts相对应,不同的是text_content、all_text_contents会匹配隐藏元素。

html代码:

<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <title>ceshi</title>
    <style>
        ul{
     
            list-style:none;
        }
    </style>
</head>
<body>
    <ul>
        <li>混合</li>
        <li style="display:block;">混合2</li>
        <li>混合3</li>
        <li>混合4</li>
    </ul>
</body>
</html>

界面效果:
在这里插入图片描述

e1 = page.locator('//ul').all_text_contents()
e2 = page.locator('//ul').all_inner_texts()

print(e1)
print(e2)

运行结果:
在这里插入图片描述

包含隐藏元素时:
在这里插入图片描述
运行结果:
在这里插入图片描述
6. inner_html,获取元素内部的HTML

e1 = page.locator('//ul').inner_html()

print(e1)

在这里插入图片描述
7. 等待元素可见
有个时候我们的代码并不是操作某个元素,而是要等待某个元素出现后,再进行其他操作,可以使用wait_for方法
有两个参数,分别为state、timeout,state,默认值为‘visible’,等待元素可见,如果值为‘hidden’,等待元素消失。
timeout默认值为30秒,超出时长,元素还没有出现,会抛出错误。

8. 判断元素是否可见
is_visible,判断在当前页面是否存在某个元素

9. 文件输入框
通过set_input_files方法

<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <title>ceshi</title>
</head>
<body>
    <input type="file" name="" id="file">
</body>
<script type="text/javascript">
    const ele = document.querySelector('#file');
    ele.onchange = function(){
     
        let file = this.files[0];
        console.log(file);
    }
</script>
</html>
page.goto(url='file:///D:/Sublime/vscode/Test_learn/playwrite2/1.html')
#
file_ele = page.locator('#file')
file_ele.set_input_files(r'D:\Sublime\vscode\Test_learn\playwrite2\test1.py')

运行结果:
在这里插入图片描述

1. 单选框、复选框

单选框的选择

  • 如果要点选radio框,可以使用Locator对象的check方法
  • 如果要取消选radio框,可以使用Locator对象的uncheck方法
  • 如果要判断radio框是否被选中,可以使用Locator对象的is_checked方法
<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <title>ceshi</title>
</head>
<body>
    <input type="radio" name="gender" value="man" checked><input type="radio" name="gender" value="female"><br>
</body>
</html>
page.wait_for_timeout(2000)
for e in eles:
    print(e.is_checked(),e.get_attribute('value'))
    if not e.is_checked():
        e.check()
        # 如果没有选中
page.wait_for_timeout(10000)

运行结果:
在这里插入图片描述
复选框

  • 如果要点选checkbox框,可以使用Locator对象的check方法
  • 如果要取消选checkbox框,可以使用Locator对象的uncheck方法
  • 如果要判断checkbox框是否被选中,可以使用Locator对象的is_checked方法
<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <title>ceshi</title>
</head>
<body>
    <input type="checkbox" name="music" value="1"> 1 <br>
    <input type="checkbox" name="music" value="2"> 2 <br>
    <input type="checkbox" name="music" value="3"> 3 <br>
    <input type="checkbox" name="music" value="4"> 4
</body>
</html>
eles = page.locator(selector='[name=music]').all()
page.wait_for_timeout(2000)
for e in eles:
    v = e.get_attribute('value')
    if int(v) % 2 == 0:
        e.check()

运行结果:
请添加图片描述

2. select下拉框

通过**select_option()**方法,里面的值可以是index、value、lable上的值,但是需要完全匹配才行。

<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <title>ceshi</title>
</head>
<body>
    <select name="sex">
        <option value="man"></option>
        <option value="female"></option>
    </select>
</body>
</html>
page.goto(url='file:///D:/Sublime/vscode/Test_learn/playwrite2/1.html')
page.locator('[name=sex]').select_option(index=1)

默认什么都没有选择,显示为男,现在选择女
在这里插入图片描述

3. 网页操作
  • page.go_back() 后退
  • page.go_forward() 前进
  • page.reload() 刷新
4. 框架页 frame

使用frame_locator找到对应frame框架页
1.html

<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <title>ceshi</title>
</head>
<body>
    <iframe src="./2.html"></iframe>
</body>
</html>

2.html

<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <title>ceshi2</title>
</head>
<body>
    <p id="name">步文曜</p>
</body>
</html>
frame = page.frame_locator('iframe')
print(frame.locator('#name').inner_text())

运行结果:
在这里插入图片描述

5. 窗口切换

需要使用BrowserContext对象创建page

<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <title>ceshi</title>
</head>
<body>
    <p id="baidu">baidu</p>
    <script>
        const e = document.querySelector('#baidu');
        e.onclick = function(){
     
            window.open('https://www.baidu.com');
        }
    </script>
</body>
</html>
page.locator('#baidu').click()
page.wait_for_timeout(2000)
print(context.pages[0].title())
print(context.pages[1].title())

运行结果:
在这里插入图片描述

6. 截屏

page.screenshot(path=‘’,full_page=True)
full_page=True,截屏截取不可见的部分,默认为False,只截取可见的部分。

最近更新

  1. TCP协议是安全的吗?

    2024-02-15 16:22:01       16 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-02-15 16:22:01       16 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-02-15 16:22:01       15 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-02-15 16:22:01       18 阅读

热门阅读

  1. 【算法】树状数组和线段树

    2024-02-15 16:22:01       29 阅读
  2. 判断能否形成等差数列

    2024-02-15 16:22:01       33 阅读
  3. 2/13作业

    2024-02-15 16:22:01       30 阅读
  4. 探索XGBoost:自动化机器学习(AutoML)

    2024-02-15 16:22:01       33 阅读
  5. USACO 2024 Jan B题解

    2024-02-15 16:22:01       36 阅读
  6. Redis的哨兵系统

    2024-02-15 16:22:01       21 阅读
  7. ARIMA时间序列

    2024-02-15 16:22:01       30 阅读
  8. conda与pip的常用命令

    2024-02-15 16:22:01       35 阅读