googlebot在抓取时会保留会话吗?

Mon*_*RPG 13 asp.net session googlebot google-crawlers

当googlebot抓取网页时,会有会话吗?例如,我在会话中存储了一些变量,并在我的网站页面中使用它们.当googlebot抓取这些页面时,我还会有会话变量吗?我global.asax在会话开始时在会话中存储了一些变量.我对谷歌机器人有任何问题吗?

MrW*_*ite 9

Googlebot会主动尝试避免会话,并且不支持Cookie.从Googlebot的第一次约会开始:标题和压缩(2008年3月)

我通常避免使用cookie(因此没有"Cookie:"标题),因为我不希望内容受会话特定信息的影响太大.而且,如果服务器在动态URL而不是cookie中使用会话ID,我通常可以解决这个问题,因此我不会最终使用一百万个不同的会话ID抓取同一页面一百万次.

我想大多数常规搜索引擎机器人在这方面都是类似的.Google正在尝试构建唯一网址的索引.URL是标识唯一内容页面的唯一键.当用户单击SERPS中的链接时,不会传递Cookie(和会话).Google主要是为网页编制索引,而不是网站.


Wik*_*hla 3

您的问题之一的答案是:是的,您在使用 Google bot 时会遇到问题。

一般来说,我们在使用 google bot 时遇到过两种类型的问题:

  1. 有时它不会在请求之间保留 HTTP cookie。我们的应用程序依赖于自定义 Cookie,并且捕获到的大量 Google 机器人请求根本不携带 Cookie。

  2. 它在连续请求之间产生长时间的中断。例如,它会检索您的页面并稍后询问其脚本。

两者都会给你的会话带来麻烦。首先 - 您需要在请求之间传递精确的 ASPNETSessionID cookie。Googlebot 有时可能无法做到这一点。其次,如果请求之间的时间间隔很长,即使 cookie 存在,您的会话也会终止。

  • 这个答案是错误的。简单的答案是不,谷歌机器人不使用会话,它会破坏谷歌搜索结果的质量。想象一下,点击 Google 搜索结果“精彩的小部件”,该结果链接到您网站上的 Google 机器人购物车,其中添加了 7 个精彩的小部件。当*您*请求该网址时,您将不会有该会话,并且您将看到一个完全空的购物车,一个毫无价值的链接。您将停止使用 Google 搜索并开始使用 Bing。 (2认同)