避免在Google上存档重复内容以获取存档页面?

jaw*_*317 4 ajax seo duplicate-data permalinks

我网站上的每篇博文(http://www.correlated.org)都以自己的固定URL存档.

在每个存档页面上,我不仅要显示已存档的帖子,还要显示之前发布的10个帖子,这样人们就可以更好地了解博客提供的内容类型.

我担心的是谷歌和其他搜索引擎会认为其他帖子是重复内容,因为每个帖子都会出现在多个页面上.

在我的另一个博客 - http://coding.pressbin.com - 我试图通过加载早期的帖子作为AJAX调用来解决这个问题,但我想知道是否有更简单的方法.

有没有办法向搜索引擎发出信号,表明页面的特定部分不应被编入索引?

如果没有,是否有一种比AJAX调用更简单的方法来做我想做的事情?

Cia*_*ran 5

警告:这还没有在野外进行过测试,但应该根据我对Google网站管理员中心博客和schema.org文档的阅读情况进行测试.无论如何...


这似乎是使用微数据构建内容的一个很好的用例.这涉及将您的内容标记为文章类型的Rich Snippet,如下所示:

   <div itemscope itemtype="http://schema.org/Article" class="item first">
      <h3 itemprop="name">August 13's correlation</h3>        
      <p itemprop="description" class="stat">In general, 27 percent of people have never had any wisdom teeth extracted. But among those who describe themselves as pessimists, 38 percent haven't had wisdom teeth extracted.</p>
      <p class="info">Based on a survey of 222 people who haven't had wisdom teeth extracted and 576 people in general.</p>
      <p class="social"><a itemprop="url" href="http://www.correlated.org/153">Link to this statistic</a></p>  
   </div>
Run Code Online (Sandbox Code Playgroud)

请注意使用itemscope,itemtypeitemprop来定义页面上的每篇文章.

现在,根据由Google,Yahoo和Bing支持的schema.org,搜索引擎应该尊重itemprop="url"上面描述的规范网址:

规范参考

通常,使用元素指定链接.例如,以下HTML链接到"麦田里的守望者"一书的维基百科页面.

<div itemscope itemtype="http://schema.org/Book">
  <span itemprop="name">The Catcher in the Rye</span>—
  by <span itemprop="author">J.D. Salinger</a>
  Here is the book's <a itemprop="url"
Run Code Online (Sandbox Code Playgroud)

href ="http://en.wikipedia.org/wiki/The_Catcher_in_the_Rye">维基百科页面.

因此,当以这种方式标记时,Google应该能够正确地归因于哪个内容属于哪个规范URL并相应地在SERP中加权.

完成内容标记后,您可以使用Rich Snippets测试工具对其进行测试,该工具可以让您在将其投入生产之前很好地了解Google的相关信息.


ps 你可以做的最重要的事情是避免重复的内容惩罚是修复永久链接页面上的标题.目前他们都阅读了" 相关 - 发现令人惊讶的相关性 ",这将导致您的排名受到重创.