拼多多职位数据信息采集

2024-07-11 04:08:03
开发
19

数据信息采集

洛哥爬虫【视频】爱写爬虫

我爱扣脚

https://careers.pinduoduo.com/jobs#/

from DrissionPage import ChromiumPage, ChromiumOptions
def fetch_pinduoduo_jobs():
    # 创建ChromiumOptions对象
    co = ChromiumOptions()
    # 提供浏览器可执行文件的路径
    path = r'C:\Program Files (x86)\Microsoft\Edge\Application\msedge.exe'
    co.set_browser_path(path)

    # 创建ChromiumPage对象
    page = ChromiumPage(co)
    # 开始监听
    api_endpoint = '/api/recruit/position/list'
    page.listen.start(api_endpoint)
    # 访问目标页面
    page.get('https://careers.pinduoduo.com/jobs#/')
    # 等待并获取一个数据包
    res = page.listen.wait()
    if res:
        print(res._raw_body)
    for pagenum in range(2, 79):
        # 点击下一页按钮
        pagenumstr = f"x://a[text()='{pagenum}']"
        next_page_button = page.ele(pagenumstr)
        page.listen.start(api_endpoint)
        if next_page_button:
            next_page_button.click()
        # 重新监听并获取数据包
        res = page.listen.wait()
        if res:
            print(res._raw_body)
        page.wait(5)
    # 关闭浏览器
    page.close()
if __name__ == '__main__':
    fetch_pinduoduo_jobs()

原文地址:https://blog.csdn.net/qq_41638872/article/details/140163102 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1811130281764196352.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部

拼多多职位数据信息采集

数据信息采集

洛哥爬虫【视频】 爱写爬虫

我爱扣脚

相关推荐

最近更新

热门阅读

洛哥爬虫【视频】爱写爬虫