元标记与robots.txt

Question

元标记与robots.txt

ker*_*lin 23 seo robots.txt meta-tags

使用元标记*或robots.txt文件来通知蜘蛛/抓取工具包含或排除网页是否更好？
使用meta标签和robots.txt时是否有任何问题？

*例如: <#META name="robots" content="index, follow">

Answer 1

小智 45

有一个显着的区别.根据Google的说法,如果页面通过其他网站链接,他们仍然会将robots.txt DENY后面的页面编入索引.

但是,如果他们看到元标记,他们就不会:

虽然Google不会抓取或索引robots.txt阻止的内容,但我们仍可能会从网络上的其他位置查找并索引不允许的网址.因此,URL地址以及可能的其他公开信息(例如网站链接中的锚文本)仍可显示在Google搜索结果中.您可以使用其他网址拦截方法阻止您的网址完全显示在Google搜索结果中,例如使用密码保护服务器上的文件或使用noindex元标记或响应标头.

根据这些[1](http://evolvedigitallabs.com/blog/robots-txt-vs-noindex-differences),[2](http://etechdiary.com/robots-txt-vs-noindex-deindex -your-site-the-right-way),[3](http://moz.com/learn/seo/robotstxt)页面,它不只是谷歌.通常,元标记用于禁止索引,而robots.txt用于禁止爬网. (7认同)
@Parapluie 完全不用担心，事实上这是一个很好的问题，而且答案并不明显。在[此页面](https://support.google.com/webmasters/answer/93710)上，谷歌告诉我们，如果我们按照您的建议使用robots.txt和元标记阻止它，如果它已经被编入索引，您的更改元标记将被“忽略”，因此它将保持索引状态，因为谷歌不允许抓取页面以查看新标记！所以答案是**始终提供元标记**。一旦您知道机器人条目已被删除或从未被编入索引，您就可以提供机器人条目（以减少请求）。 (2认同)

Answer 2

CJM*_*CJM 7

Robots.txt 恕我直言。

Meta 标记选项告诉机器人不要索引单个文件，而 Robots.txt 可用于限制对整个目录的访问。

当然，如果您想要跳过索引文件夹中的奇数页，请使用元标记，但一般来说，我建议您将大部分非索引内容放在一个或多个文件夹中，并使用 robots.txt 来跳过这部分内容。

不，使用两者没有问题 - 如果存在冲突，一般来说，拒绝将推翻允许。

归档时间：	15 年，7 月前
查看次数：	16093 次
最近记录：	6 年，7 月前