dbpedia 以英语以外的语言获取实体

Til*_*ney 4 wikipedia owl foaf sparql dbpedia

我正在尝试使用 sparql 从 dbpedia 中提取包含人名等的实体字典。

PREFIX owl: <http://dbpedia.org/ontology/>
PREFIX dbpprop: <http://dbpedia.org/property/>
SELECT ?name
WHERE {
    ?person a owl:Person .

    ?person dbpprop:name ?name . FILTER(lang(?name) = "en")
}
Run Code Online (Sandbox Code Playgroud)

上面的查询确实成功了,但是当我将语言名称更改为 时fr,没有任何东西可以获取。

如何获取其他语言的名称?

此外,为什么我不能使用下面的查询过滤语言?

SELECT ?name
WHERE {
    ?person a owl:Person .
    ?person dbpprop:language "English"
    ?person dbpprop:name ?name . 
}
// this query returns nothing
Run Code Online (Sandbox Code Playgroud)

我尝试使用获取所有语言

SELECT DISTINCT ?lanName
WHERE {
    ?person a owl:Person .
    ?person dbpprop:language ?lanName .
}
Run Code Online (Sandbox Code Playgroud)

并且结果集包含English.

Jos*_*lor 5

您需要根据属性值的语言进行过滤。并非每个属性都有不同语言的值,但有些属性会有。从您的示例来看,似乎dbpprop:name并非在每种语言中都有值。如果您查看其他语言特定的 DBpediae,您可能会在其他语言中找到更多值。

但是,对于名称之类的东西,如果您使用rdfs:label属性,您可能会得到多语言结果。例如,要获取俄语版 Barack Obama、Daniel Webster 和 Johnny Cash 的名字,您可以执行以下操作:

select ?label {
  values ?person { dbpedia:Johnny_Cash dbpedia:Barack_Obama dbpedia:Daniel_Webster }
  ?person rdfs:label ?label .
  filter langMatches(lang(?label),"ru")
}
Run Code Online (Sandbox Code Playgroud)

SPARQL 结果

顺便一句,请注意使用langMatches而不是相等来匹配语言标签。这通常是一种更好的方法,因为它会正确处理一种语言中的不同语言标记。例如(来自 SPARQL 规范),您可以找到两种法语文字:

"Cette Série des Années Soixante-dix"@fr .
"Cette Série des Années Septante"@fr-BE .
Run Code Online (Sandbox Code Playgroud)

langMatches(lang(?title),"fr"),但只有第一个与lang(?title) = "fr"