如何在网站上找到sitemap.xml路径?

jac*_*des 41 sitemap web-crawler

如何找到网站的sitemap.xml文件?

例如,转到stackoverflow/sitemap.xml会得到404.

在stackoverflow/robots.txt中写入以下内容:

"这在技术上是无效的,因为出于一些荒谬的原因,站点地图路径必须是ABSOLUTE而不是相对的.站点地图:/sitemap.xml"

Kir*_*and 94

没有标准,所以没有保证.话虽如此,站点地图常见的是自我标记和根目录,如下所示:

example.com/sitemap.xml

Case在某些服务器上很敏感,因此请记住这一点.如果不存在,请查看根目录中的robots文件:

example.com/robots.txt

如果您没有在漫游器文件中看到它,请前往Google并搜索:

site:example.com filetype:xml

这会将结果限制为目标域上的XML文件.此时它的反复试验和基于您正在使用的网站的细节.如果您从上面的Google搜索词组中获得了几页结果,请尝试进一步限制结果:

filetype:xml site:example.com inurl:sitemap

要么

filetype:xml site:example.com inurl:products

如果你仍然找不到它,你可以right-click > "View Source"进行搜索(又名:"控制查找"或Ctrl + F).xml以查看代码中是否有对它的引用.

  • 用于查找robots.txt文件的+1 - 这说明了根目录中没有sitemap.xml的站点.现在为其他20%.... (4认同)

mak*_*mov 20

我认为站点地图的位置没有标准.这就是为什么当您使用Google的网站管理员工具添加网站地图时,应该为网站地图指定任意网址的原因.