有没有办法从dcterms:subjectdbpedia中检索所有类别?
例如,在http://dbpedia.org/page/Eiffel_Tower中,我可以在dcterms中看到:主题如下:
我希望检索category:xxxdbpedia中的所有值.有办法吗?
如果您使用以下SPARQL查询执行COUNT查询以查看dbpedia中有多少类别:
SELECT COUNT(DISTINCT ?category) AS ?count WHERE {?subject dcterms:subject ?category}
Run Code Online (Sandbox Code Playgroud)
你会得到dbpedia有503788类别.如果您查询所有类别,端点将不会为您提供整个503788类别,因为它会限制您可以获得多少结果.但是您可以使用LIMIT和OFFSET发出多个查询.例如,要获取前1000个类别,您可以执行以下查询:
SELECT DISTINCT ?category WHERE {?subject dcterms:subject ?category} LIMIT 1000 OFFSET 0
Run Code Online (Sandbox Code Playgroud)
我不知道你将如何使用这些信息,但我的建议是运行多个查询并增加偏移量(例如1000,2000,3000)并将结果缓存在您正在使用的任何存储中.您基本上可以编写一个执行查询的程序,并将结果放在缓存中.
但请记住,DBPedia中的类别是分层的,因此一个类别是来自其他几个类别的borader类别.