查看 WikiTeam 提供的工具。http://archiveteam.org/index.php?title=WikiTeam
我个人使用 wikiteam 的 dumpgenerator.py,它可以在这里找到:https : //github.com/WikiTeam/wikiteam
这取决于python 2。您可以使用git获取软件或从github下载zip:
git clone https://github.com/WikiTeam/wikiteam.git
Run Code Online (Sandbox Code Playgroud)
基本用法是:
python dumpgenerator.py http://wiki.domain.org --xml --images
Run Code Online (Sandbox Code Playgroud)
如果 wiki 的维护者没有关闭它,您可以通过Special:Export导出页面及其历史记录。这将为您提供类似于 Wikipedia 数据库转储的 XML 转储,然后您可以将其导入到另一个 wiki 中。
从 MediaWiki 获取 XML 格式的页面历史记录的另一种方法是使用prop=revisions API 查询。但是,API 结果格式与 Special:Export 生成的格式有些不同,因此您可能需要对输出进行一些处理,然后才能将其提供给标准导入脚本。
归档时间: |
|
查看次数: |
8891 次 |
最近记录: |