Chrome-Dev-Tool :- 亚马逊中的 csm-hit cookie

Pyt*_*ast 5 cookies web-scraping google-chrome-devtools

我正在尝试在抓取亚马逊时设置cookie,以免被抓住并看起来像一个真实的用户。

我正在尝试复制该网站的行为。我已经完全分析了标头、请求和响应签名等。唯一发生变化的是cookies、 以及csm-hit。我理解更新visitCount背后的逻辑,但不理解。visitCountcsm-hit

这是csm-hit饼干。

tb:s-Y4SB9X78SYQB53MGCQWE|1551555477343&t:1551555479805&adb:adblk_no
Run Code Online (Sandbox Code Playgroud)

它的格式如下:-

tb:s - ALPHANUMERIC | EPOCH_TIME &t EPOCH_TIME &adb:adblk_no
Run Code Online (Sandbox Code Playgroud)

这个字母数字字符(看起来像 base64 编码)不断变化。updateCsmHit它在重新加载/重定向出亚马逊时调用一个函数,然后更新csm-hit该值,然后在下次向服务器发出请求时重新使用相同的更新值。如果此 cookie 尚未保存在浏览器中,则它不会发送csm-hit请求,而是在我们走出亚马逊时保存它。

我已经使用 Chrome Dev 工具分析了完整的源代码,但无法破解生成此字母数字值的逻辑。

  1. 我想了解这个值是如何生成的,以便我可以使用相同的逻辑来复制它的生成?任何人都可以使用 Chrome 开发工具在这方面帮助我。

  2. 有谁知道 的意义吗csm-hit

PS:请不要建议我csm-hit每次都使用相同的。我想知道这是如何生成的。