维基百科如何生成它的站点地图?

10 wiki sitemap

由于维基百科的规模,我对这个话题很感兴趣。在一个小站点中创建一些 cron 来定期更新站点地图可能很容易,但是一个大站点呢?所以:

维基百科如何生成它的站点地图?

小智 9

它是由 PHP 脚本动态生成的。对于大型站点,最好检查更改并仅在发生更改时生成 - 或者仅每隔 XY 分钟/小时/天生成一次。这取决于基础设施。

所需的信息都在数据库中,所以这不是一项艰巨的任务。

这是证据:http : //svn.wikimedia.org/viewvc/mediawiki/trunk/phase3/maintenance/generateSitemap.php ? view= log / http://www.mediawiki.org/wiki/Manual:GenerateSitemap。 php

编辑:啊,这对这个话题也很有趣:

  • 我还认为 OP 正在努力研究如何在“大型”站点上生成站点地图,在 Wikipedia 的情况下,它非常依赖 RDBMS 驱动(MySQL),所有页面都从数据库中提供。因此,您的数据库知道所有页面,并且您需要一个简单的 PHP 脚本(上面从 Subversion 链接)来执行此操作。对于由不同技术驱动的其他站点,您会发现所需的方法是不同的。上次我查看 Wikipedia 发布了他们的数据库供下载时,或者至少,他们将内容发布在 .SQL 文件中。 (3认同)