Parsoid - 在本地解析维基文本

pre*_*pic 2 html localhost wikitext parsoid

这甚至可能吗?

我不确定,如果我正确理解这个项目。我正在尝试使用 Parsoid-JSAPI 项目将大量 wikitext 解析为 html。

解析工作正常,但它仍在调用维基媒体 API。我已经在本地运行服务器,但该库仍在使用公共 Internet API 而不是我的本地服务器。如果我尝试指定域,调用Parsoid.parse("wikitext", {domain: 'localhost'}),它说No API URI available for prefix: null; domain: localhost

我的 config.yaml:

mwApis:
    uri: 'http://localhost/w/api.php'
    domain: 'localhost'
Run Code Online (Sandbox Code Playgroud)

Tgr*_*Tgr 5

当然可以解析维基文本;这就是 Parsoid 所做的。解析 Wikipedia 内容是不可能的(没有 API 调用),因为 1) 模板和其他嵌入的内容需要解决,2) 一些标记由扩展管理,Parsoid 遵从它们。

您可以设置本地 MediaWiki 实例,设置所有必需的扩展,并导入所有相关页面(导出内容时有一个“包含模板”选项),但这很费力。