Pyt*_*ast 5 cookies web-scraping google-chrome-devtools
我正在尝试在抓取亚马逊时设置cookie,以免被抓住并看起来像一个真实的用户。
我正在尝试复制该网站的行为。我已经完全分析了标头、请求和响应签名等。唯一发生变化的是cookies、 以及csm-hit。我理解更新visitCount背后的逻辑,但不理解。visitCountcsm-hit
这是csm-hit饼干。
tb:s-Y4SB9X78SYQB53MGCQWE|1551555477343&t:1551555479805&adb:adblk_no
Run Code Online (Sandbox Code Playgroud)
它的格式如下:-
tb:s - ALPHANUMERIC | EPOCH_TIME &t EPOCH_TIME &adb:adblk_no
Run Code Online (Sandbox Code Playgroud)
这个字母数字字符(看起来像 base64 编码)不断变化。updateCsmHit它在重新加载/重定向出亚马逊时调用一个函数,然后更新csm-hit该值,然后在下次向服务器发出请求时重新使用相同的更新值。如果此 cookie 尚未保存在浏览器中,则它不会发送csm-hit请求,而是在我们走出亚马逊时保存它。
我已经使用 Chrome Dev 工具分析了完整的源代码,但无法破解生成此字母数字值的逻辑。
我想了解这个值是如何生成的,以便我可以使用相同的逻辑来复制它的生成?任何人都可以使用 Chrome 开发工具在这方面帮助我。
有谁知道 的意义吗csm-hit?
PS:请不要建议我csm-hit每次都使用相同的。我想知道这是如何生成的。
| 归档时间: |
|
| 查看次数: |
2279 次 |
| 最近记录: |