使用category和categorylinks表查找维基百科类别的子类别

Bha*_*wal 1 mediawiki

我从mediawiki下载了类别和categorylinks表sql.gz文件,并生成了所需的表:

类别和类别链接

表格手册: CategoryLinks 类别

请考虑以下类别页面:NoSQL 此页面的父类别是数据库和数据库管理.我如何从这两个表中获取此信息?类别表的手册说明如下,但我无法获得该信息:"

注意:页面和子类别存储在categorylinks表中."

pok*_*oke 7

单独的类别没有层次结构.这是使子类别化工作的类别页面.因此,您还必须page_idpage表中获取才能解决此关系.

它基本上是这样的:

  1. 类别cat_title是页面标题.
  2. 查找page_title的页表,得到page_id
  3. 使用page_id以获取类别链接cl_from
  4. 从中获取父类别标题 cl_to
  5. 重复2