我正在尝试对DBpedia使用SPARQL查询来检索音乐剧列表和一些相关属性.然而,尽管使用了适当的滤镜(据我所知),结果包括许多音乐剧不止一次.这是我的查询:
PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
PREFIX dbo: <http://dbpedia.org/ontology/>
PREFIX dbpprop: <http://dbpedia.org/property/>
SELECT ?label ?abstract ?book ?music ?lyrics
WHERE {
?play <http://purl.org/dc/terms/subject> <http://dbpedia.org/resource/Category:Broadway_musicals> ;
rdfs:label ?label ;
dbo:abstract ?abstract ;
dbpprop:book ?book ;
dbpprop:lyrics ?lyrics ;
dbpprop:music ?music .
FILTER (LANG(?label) = 'en')
FILTER (LANG(?abstract) = 'en')
FILTER (LANG(?book) = 'en')
FILTER (LANG(?lyrics) = 'en')
FILTER (LANG(?music) = 'en')
}
Run Code Online (Sandbox Code Playgroud)
结果列表包含许多重复条目.在这里粘贴查询: DBpedia SPARQL Explorer,你会看到从'妈妈咪呀开始!' 列表中有很多重复项.
知道我缺少什么来获得独特的结果,没有重复?谢谢!
[由格伦麦克唐纳编辑,澄清它的音乐剧在这里"重复",而不是三重奏.]
SPARQL返回变量绑定.您的"重复"是投影属性中倍数的笛卡尔积.Mamma Mia有多位音乐作家和多位词作者,因此您可以获得可能在您的桌子中产生一排的所有可能的组合.
多么痛苦啊?"解决方案"是使用CONSTRUCT而不是SELECT,并处理返回图形而不是表格.也许是这样的: