爬虫实践(1)

这一篇只提登录模拟,主要介绍chrome开发者窗口的使用,实际上相关接口调用都是用到cookie,需要再加一篇从token到cookie,以保证实践的完整性

以migu登录为例,分析其登录过程,之后可以使用任意语言模拟登录,获取登录token

查看分析登录涉及到的URL

URL:https://passport.migu.cn/login
step1: POST https://passport.migu.cn/password/publickey
step2: POST https://passport.migu.cn/authn
在这里插入图片描述
step2 返回结果就是登录后的token
在这里插入图片描述

分析请求报文

step1:POST https://passport.migu.cn/password/publickey
无参数,尝试直接请求,可以获取到请求在这里插入图片描述
step2:POST https://passport.migu.cn/authn
发现请求参数很多,大部分是加密的
在这里插入图片描述
试着使用POSTMAN做请求,暂时发现使用以下三个参数就可以通了
在这里插入图片描述

分析参数计算逻辑

这是主要部分,大致流程:找到对应form --> 打断点 --> 分析代码

sourceID,Element搜索,尝试点两下登录,发现这个值应该是进页面初始化的

在这里插入图片描述
可以直接通过请求URL 获取
在这里插入图片描述

loginID
  1. Element搜索,可以点两下登录试试,可以看到这个值会变化,说明是动态计算的
    在这里插入图片描述
  2. 打断点
    在这里插入图片描述
  3. 点击登录按钮,触发click事件,会停在赋值的代码块,可见此时 loginID已经算出来了,并在第二个标记的地方赋值
    在这里插入图片描述
    shift + F11 往上推查找这个e在什么地方算的
    分析下面代码,发现是通过请求a.attr(“cmcc-rsaAjax”),获取到modulus, publicExponent,再通过RSA做加密,算出 loginID
    这个URL其实就是https://passport.migu.cn/password/publickey这个API的结果
    在这里插入图片描述
    有个技巧, 在打断点期间,实际上整个工作区间都到断掉位置了,可以在console 窗口直接在执行代码,比如:
    在这里插入图片描述
    RSA加密算法是自定义的,需要爬取js代码,之后再做补全 …
    主要是下面三行代码
c = new s.RSAKey;
c.setPublic(a.result.modulus, a.result.publicExponent);
var d = c.encrypt(b.val());
enpassword,步骤相似,实际上就是下面中间的代码

在这里插入图片描述

相关推荐

  1. Python爬虫实战-1

    2024-04-01 18:18:03       32 阅读
  2. Python爬虫实现“自动重试”机制的方法(1

    2024-04-01 18:18:03       26 阅读
  3. 3.1.爬虫

    2024-04-01 18:18:03       37 阅读
  4. 爬虫项目(1

    2024-04-01 18:18:03       48 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-04-01 18:18:03       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-04-01 18:18:03       101 阅读
  3. 在Django里面运行非项目文件

    2024-04-01 18:18:03       82 阅读
  4. Python语言-面向对象

    2024-04-01 18:18:03       91 阅读

热门阅读

  1. Profile Recovery

    2024-04-01 18:18:03       41 阅读
  2. 安装pygimli

    2024-04-01 18:18:03       38 阅读
  3. 如何理解 Vitalik 新文对以太坊扩容的思考?

    2024-04-01 18:18:03       45 阅读
  4. 什么是适配器模式

    2024-04-01 18:18:03       44 阅读
  5. 北京2024年注册技术咨询公司新材料与流程全攻略

    2024-04-01 18:18:03       26 阅读
  6. 【 自动化构建 】深入前端脚手架实现原理

    2024-04-01 18:18:03       29 阅读
  7. python爬虫下载音乐

    2024-04-01 18:18:03       30 阅读
  8. PHP反序列化

    2024-04-01 18:18:03       37 阅读
  9. 基于单片机控制的高速数据采集与处理系统研究

    2024-04-01 18:18:03       33 阅读
  10. 蓝桥杯单片机第九届国赛——多功能测量仪表

    2024-04-01 18:18:03       31 阅读
  11. C++20之Concept

    2024-04-01 18:18:03       28 阅读
  12. leetCode-01

    2024-04-01 18:18:03       27 阅读