【爬虫常识】常见登录流程
常见的登录流程一般有两种,情况不同,在基于爬虫实现自动登录时,也需要做不同的调整。
1.3.1 方式1
正常请求流程:
- 第1次访问,后台会返回内容+Cookie,在cookie中保存当前用户凭证(此时凭证没啥用)
- 第2次访问,输入用户名+密码提交,此时浏览器会自动将第1次返回的凭证携带到后台; 后台校验成功,此时给凭证赋予登录权限(还是原来的凭证,只不过此时的凭证是用户已登录的标识了)。
- 第n次访问,携带Cookie中的凭证去访问,后台就会根据凭证(用户标识)返回词用户的相关信息。
如果我们基于爬虫去模拟请求实现时:
- 第1次访问,读取返回Cookie并保存
- 第2次访问,携带用户名+密码+上次的Cookie进行登录
- 第n次访问,携带Cookie去访问,获取当前用户信息。
1.3.2 方式2
正常请求流程:
- 第1次访问,后台仅返回页面。
- 第2次访问,输入用户名+密码提交,后台校验成功后,在 响应体 或 Cookie 返回 用户登录凭证。【网页一般在Cookie中居多】
- 第n次访问,携带之前返回的凭证去访问,后台就会根据凭证(用户标识)返回词用户的相关信息。
如果我们基于爬虫去模拟请求实现时:
- 第2次访问,携带用户名+密码去登录,在 响应体 或 Cookie中读取用户凭证。【网页一般在Cookie中居多】
- 第n次访问,携带凭证去访问,获取当前用户信息。