我正在探索如何使用维基百科的分类信息从我的内容中提取标签/关键字.
我找到了关于DBPedia的文章.DBpedia是一项社区工作,旨在从维基百科中提取结构化信息,并在Web上提供此信息.
有没有人使用他们的网络服务?你知道它们的工作原理和可靠性吗?
如何获取特定类的属性列表?考虑上课dbpedia-owl:Person
.Person
该类的所有实例都有一些前缀为的属性dbpprop:
.如何获得dbpprop:
我们可能为所有Person
类实例找到的所有属性?
在<some Wikipedia article>中有这个花哨的信息框.如何获得<this field and that>的值?
我正在寻找使用人类可读数据增强应用程序中的几个"对象".为此,我见过Freebase,DBpedia和wikidata.org,目前我正在使用Freebase.不过,我不禁想知道我错过了什么.
那么:有什么区别?具体而言,覆盖差异是什么,以及为最常见的维基百科文章类型(例如"人物","地点","艺术家","专辑"等)提供的数据的差异是什么.
我是新来的查询DBPedia.如何从http://dbpedia.org/sparql获取所有公司?
此查询仅返回50'000个组织:
SELECT DISTINCT * WHERE {?company a dbpedia-owl:Company}
Run Code Online (Sandbox Code Playgroud) 为了获得所有可能的电影名称,我使用了sparql查询:
PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
SELECT DISTINCT ?film_title ?film_abstract
WHERE {
?film_title rdf:type <http://dbpedia.org/ontology/Film> .
?film_title rdfs:comment ?film_abstract
}
Run Code Online (Sandbox Code Playgroud)
它只给了我一万部电影.DBpedia在其网站上提到它有大约60,000部电影.对于我的应用程序,我需要所有可能的电影.有人可以指导我有什么其他可能性来获得其余的电影
我正在尝试使用SPARQL查询来检索有关DBpedia资源(Person)的信息.我想通过参数化资源URI使用相同的查询来检索有关任何Person的数据.由于特定资源可能不存在某些属性,因此我正在使用OPTIONAL语句.这是我的查询:
PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
PREFIX dbo: <http://dbpedia.org/ontology/>
PREFIX dbpprop: <http://dbpedia.org/property/>
PREFIX foaf: <http://xmlns.com/foaf/0.1/>
SELECT DISTINCT ?label ?abstract ?placeOfBirth
?birthPlace ?birthDate ?deathDate ?page ?thumbnail
WHERE {
<http://dbpedia.org/resource/Neil_Simon> rdfs:label ?label ;
dbo:abstract ?abstract ;
foaf:page ?page .
OPTIONAL {
<http://dbpedia.org/resource/Neil_Simon> dbpprop:placeOfBirth ?placeOfBirth ;
dbpprop:birthPlace ?birthPlace ;
dbo:birthDate ?birthDate ;
dbo:deathdate ?deathDate ;
dbo:thumbnail ?thumbnail .
}
FILTER (LANG(?label) = 'en')
FILTER (LANG(?abstract) = 'en')
}
LIMIT 1
Run Code Online (Sandbox Code Playgroud)
我在OPTIONAL中留下了除标签,摘要和页面之外的所有内容,因为如果我对另一个人使用相同的查询,则可能没有这些属性.问题是,结果中没有显示这些可选属性.在Neil Simon的案例中,您可以看到birthDate,birthPlace和缩略图的值:http://dbpedia.org/resource/Neil_Simon .但是,当我运行查询时,这些值不会显示:DBpedia SPARQL查询.我做错了什么,如何选择性地检索这些属性?
我正在尝试查询DBPedia以获取与本体中给定类相关的属性列表,但由于人类可读的"标签"并不总是清晰,我还想提供数据库中的示例.问题是,虽然我想选择所有不同的属性,但我只想要每个属性的一个例子.以下是我的查询在不捕获示例的情况下的外观:
SELECT DISTINCT ?prop ?title WHERE {
?thing ?prop [].
?thing a <http://dbpedia.org/ontology/Currency>.
?prop rdf:type rdf:Property.
?prop rdfs:label ?title.
} ORDER BY DESC(COUNT(DISTINCT ?thing))
LIMIT 100
Run Code Online (Sandbox Code Playgroud)
如果我以这种方式更改它,我开始为?prop获取重复值:
SELECT DISTINCT ?prop ?title ?example WHERE {
?thing ?prop ?example.
?thing a <http://dbpedia.org/ontology/Currency>.
?prop rdf:type rdf:Property.
?prop rdfs:label ?title.
} ORDER BY DESC(COUNT(DISTINCT ?thing))
LIMIT 100
Run Code Online (Sandbox Code Playgroud)
我一般都非常习惯使用SPARQL和数据库查询,因此我不清楚如何执行此操作.理想情况下,我有类似DISTINCT(?prop)?title?example的内容,它为prop选择每个唯一值,并返回其标题和示例.
我正在使用此SPARQL查询查询dbpedia.org以获取有关Big Ben的描述:
select ?desc
where {
<http://dbpedia.org/resource/Big_Ben> <http://www.w3.org/2000/01/rdf-schema#comment> ?desc
}
Run Code Online (Sandbox Code Playgroud)
这将返回至少10种不同语言的描述列表.如何指定我只想要英文描述?
但如果我想用意大利语检索信息?
它有另一种服务(类似这个)可以吗?