Multistream Wikipedia转储

m4r*_*ri0 15 xml wiki wikipedia bzip2 wikimedia-dumps

我下载了德语维基百科dump dewiki-20151102-pages-articles-multistream.xml.我的简短问题是:在这种情况下,"多流"意味着什么?

Dav*_*lla 19

转储使用bz2压缩,bz2支持并行版本,允许它更快地压缩/解压缩文件.使用并行版本的压缩数据被标记为multistream.

当您从编程语言处理转储时,了解此信息会有所不同,因为您必须传递一个标志来告诉库如何解压缩它(并行或非并行).


Rob*_*obC 5

multistream允许使用索引根据需要解压缩部分,而不必解压缩整个内容。

这允许读者从压缩转储中提取文章。