Lin*_*sku 6 search search-engine
在我的WordPress博客中,我?在每个帖子上都有"发布几天前".我的主页上有10个帖子.因此,根据大多数关键字分析工具,"几天前"是我博客上的顶级关键字,但我不希望它.如何隐藏搜索引擎中的这些单词?
我不想使用Javascript.我可以很容易地使用PHP和$_SERVER变量,但我担心我可能因为隐藏真的而受到惩罚.是否有HTML标签或rel="nofollow"我可以使用的属性?
据说您可以将类添加
robots-nocontent到页面上的元素中,如下所示:Run Code Online (Sandbox Code Playgroud)<div class="robots-nocontent"> <p>Ignore this stuff.</p> </div>雅虎尊重这一点,但我不知道其他搜索引擎是否尊重这一点。谷歌目前似乎不支持这一点。我怀疑如果您通过 ajax 加载您的内容,您将获得与页面上不存在相同的效果。
和
没有通用的方法可以做到这一点,我个人不会为此烦恼。搜索引擎非常擅长识别页面上的相关内容,即使该内容可能会出现在搜索引擎找到的关键字中,但这并不意味着它会使页面与这些关键字相关。
如果你有一个关于“鱼”的页面和一个关于“狗”的页面(在侧边栏中有一个关于“鱼”的页面的链接),搜索引擎通常能够识别出关于“鱼”的页面是与在侧栏中提到“鱼”的有关“狗”的页面相比,与“鱼”的相关性要高得多。有可能在某个时候找到这两个页面,但通常考虑到该站点的大部分页面都显示在搜索结果中,这不值得担心。
没有必要对此感到幻想,如果您尝试,搜索引擎可能会变得更加困惑(例如,如果您使用 JavaScript 隐藏内容,无论如何您永远不知道搜索引擎何时会开始找到该内容)。同样,使用带有 robots.txt 不允许或 AJAX 的 iframe 会经常降低用户页面的质量(减慢速度或使其在各种设备上的可用性降低),因此除非有非常、非常有力且经过验证的理由你需要这样做,我强烈建议不要打扰它。
我在维基上发现的:
对于Yandex:
<!--noindex-->Don't index this text.<!--/noindex-->
Run Code Online (Sandbox Code Playgroud)
对于雅虎:
<div class="robots-nocontent">Don't index this text.</div>
Run Code Online (Sandbox Code Playgroud)
对于谷歌:
<!--googleoff: index--> Don't index this text.<!--googleon: index-->
Run Code Online (Sandbox Code Playgroud)
Linksku,我相当确定您不应该担心那段特定的文字。我们的算法在检测样板文本方面做得相对较好。据我从你的问题中可以看出,这篇文章是样板文件,我们可能已经知道了。
至于检测 Googlebot 并且不为其提供此文本,你是对的,那将是伪装,你永远不应该这样做。在这种情况下,如果您向我们隐藏该文本,我们也将很难检测到它的样板文件,并且您最终会做您想要避免的事情:)