如何隐藏搜索引擎中的某些文字?

Lin*_*sku 6 search search-engine

在我的WordPress博客中,我?在每个帖子上都有"发布几天前".我的主页上有10个帖子.因此,根据大多数关键字分析工具,"几天前"是我博客上的顶级关键字,但我不希望它.如何隐藏搜索引擎中的这些单词?

我不想使用Javascript.我可以很容易地使用PHP和$_SERVER变量,但我担心我可能因为隐藏真的而受到惩罚.是否有HTML标签或rel="nofollow"我可以使用的属性?

Joh*_*nde 6

有没有办法让搜索引擎不能索引的网页的某一部分?

据说您可以将类添加 robots-nocontent到页面上的元素中,如下所示:

<div class="robots-nocontent">

    <p>Ignore this stuff.</p>

</div>
Run Code Online (Sandbox Code Playgroud)

雅虎尊重这一点,但我不知道其他搜索引擎是否尊重这一点。谷歌目前似乎不支持这一点。我怀疑如果您通过 ajax 加载您的内容,您将获得与页面上不存在相同的效果。

没有通用的方法可以做到这一点,我个人不会为此烦恼。搜索引擎非常擅长识别页面上的相关内容,即使该内容可能会出现在搜索引擎找到的关键字中,但这并不意味着它会使页面与这些关键字相关。

如果你有一个关于“鱼”的页面和一个关于“狗”的页面(在侧边栏中有一个关于“鱼”的页面的链接),搜索引擎通常能够识别出关于“鱼”的页面是与在侧栏中提到“鱼”的有关“狗”的页面相比,与“鱼”的相关性要高得多。有可能在某个时候找到这两个页面,但通常考虑到该站点的大部分页面都显示在搜索结果中,这不值得担心。

没有必要对此感到幻想,如果您尝试,搜索引擎可能会变得更加困惑(例如,如果您使用 JavaScript 隐藏内容,无论如何您永远不知道搜索引擎何时会开始找到该内容)。同样,使用带有 robots.txt 不允许或 AJAX 的 iframe 会经常降低用户页面的质量(减慢速度或使其在各种设备上的可用性降低),因此除非有非常、非常有力且经过验证的理由你需要这样做,我强烈建议不要打扰它。


gar*_*rik 5

我在维基上发现的:

对于Yandex

<!--noindex-->Don't index this text.<!--/noindex-->
Run Code Online (Sandbox Code Playgroud)

对于雅虎

<div class="robots-nocontent">Don't index this text.</div>
Run Code Online (Sandbox Code Playgroud)

对于谷歌

<!--googleoff: index--> Don't index this text.<!--googleon: index-->
Run Code Online (Sandbox Code Playgroud)

  • 重要的是要知道 googleoff 专门与 Google Search Appliance 相关,而不是 Google 本身。请参阅:http://webmasters.stackexchange.com/questions/54735/can-you-use-googleon-and-googleoff-comments-to-prevent-googlebot-from-indexing-p (5认同)

met*_*ode 1

Linksku,我相当确定您不应该担心那段特定的文字。我们的算法在检测样板文本方面做得相对较好。据我从你的问题中可以看出,这篇文章是样板文件,我们可能已经知道了。

至于检测 Googlebot 并且不为其提供此文本,你是对的,那将是伪装,你永远不应该这样做。在这种情况下,如果您向我们隐藏该文本,我们也将很难检测到它的样板文件,并且您最终会做您想要避免的事情:)