什么数据存储模型用于在Wikipedia中存储文章

xyz*_*xyz 5 mysql database storage wikipedia data-structures

维基百科中的文章得到编辑。它们可以增长/缩小/更新等。下面使用什么文件系统/数据库存储布局等来支持它。在数据库课程中,我已经阅读了一些有关可变长度记录的信息,但是对于小字符串而不是整个文档来说,这似乎更多。就像在文件系统中一样,文件可以增长/缩小等,我认为可以通过将块链接在一起来完成。每次,我们更新一个文件,而不是整个文件都被重写。也许这里会做类似的事情。

我正在寻找特定的名称,术语,甚至可能是如何定义mysql中的架构。(我认为维基百科使用mysql)。

以下是有关Wikipedia体系结构的一些文章的链接,但我无法从这些问题中回答我的问题:

http://swe.web.cs.unibo.it/twiki/pub/WikiFactory/AntonelloDiMuroThesis/Wikipedia-cheapandexplosivescalingwithLAMP.pdf

http://dom.as/uc/workbook2007.pdf

谢谢,

Den*_*rdy 4

看:

http://www.mediawiki.org/wiki/Manual:Database_layout

  • @p2pnode 有关编辑的信息不存储在那里,它成为修订和文本表中的新行。该结构在 http://www.mediawiki.org/wiki/Manual:Page_table 中有更多解释。页表存储有关页面的信息,修订版存储有关各种修订版或“编辑”的信息,实际的页面文本存储在文本页中。每个修订版都会存储整个页面文本,即使它是“中间的编辑”,您也可以使用一些外部 diff 工具或代码来可视化各个修订版之间已更改/编辑的内容,这不是 mysql 关心的事情。 (2认同)