当用户进入我的页面时,我必须进行另一个AJAX调用...以在div中加载数据.这就是我的应用程序的工作原理.
问题是......当我查看此代码的来源时,它不包含该AJAX的源代码.当然,当我做wget URL时......它也没有显示AJAX HTML.说得通.
但谷歌怎么样?Google能否抓取内容,就好像它是一个浏览器一样?如何让Google像对待用户一样抓取我的网页?
phi*_*reo 10
实际上...... Google确实有一个抓取Ajax应用程序的解决方案......
http://code.google.com/web/ajaxcrawling/docs/getting-started.html
更新:从关于"Ajax生成的内容,抓取和黑名单"的问题的答案中,我找到了关于Google抓取AJAX请求的方式的文档,这是关于使AJAX应用程序可抓取的文档集合的一部分.
简而言之,这意味着您需要使用<a href="#!data">...</a>而不是<a href="#data">...</a>然后提供URL的真实服务器端答案path/to/path?_escaped_fragment_=data.
还要考虑一个<link/>标签,为爬虫提供SEO友好内容的提示.<link rel="canonical"/>,这篇文章解释了一下,是一个很好的候选人
注意:我从以下网址获得了答案:https://stackoverflow.com/questions/10006825/search-engine-misunderstanting/10006925#comment12792862_10006925 因为我似乎无法删除我的.
| 归档时间: |
|
| 查看次数: |
12388 次 |
| 最近记录: |