来自名称的维基数据实体价值

Oro*_*oku 18 wikidata wikidata-api

有没有办法根据实体的名称获取维基数据页面信息,例如,如果我想获取谷歌的页面数据.我认为必须使用具有相应实体值的"实体"来完成,但我不确定是否有任何简单的方法来确定实体值.

svi*_*ick 16

如果您想使用API​​执行此操作,您首先要使用它wbsearchentities来找出您想要的实体.例如:

https://www.wikidata.org/w/api.php?action=wbsearchentities&search=Google&language=en

问题在于,有多个实体称为"谷歌":公司(谷歌公司),搜索引擎(谷歌网络搜索),动词(谷歌),甚至维基百科消歧页面.

在您以某种方式决定访问哪个实体后,使用wbgetentities实际获取所需的信息:

https://www.wikidata.org/w/api.php?action=wbgetentities&ids=Q95&languages=en

或者,如果您无法决定使用哪个实体,则可以同时获取所有实体的信息:

https://www.wikidata.org/w/api.php?action=wbgetentities&ids=Q95|Q9366|Q961680|Q1156923&languages=en


And*_*dra 9

如果您熟悉Python,可以使用Pywikibot以编程方式使用Pywikibot以下python脚本获取wikidata实体.如果需要每个wikidata实体的数据对象,则需要取消注释最后两行

 from pywikibot.data import api
 import pywikibot
 import pprint

 def getItems(site, itemtitle):
     params = { 'action' :'wbsearchentities' , 'format' : 'json' , 'language' : 'en', 'type' : 'item', 'search': itemtitle}
     request = api.Request(site=site,**params)
     return request.submit()

 def getItem(site, wdItem, token):
    request = api.Request(site=site,
                          action='wbgetentities',
                          format='json',
                          ids=wdItem)    
    return request.submit()

def prettyPrint(variable):
    pp = pprint.PrettyPrinter(indent=4)
    pp.pprint(variable)

# Login to wikidata
site = pywikibot.Site("wikidata", "wikidata")
repo = site.data_repository()
token = repo.token(pywikibot.Page(repo, 'Main Page'), 'edit')
wikidataEntries = getItems(site, "Google")
# Print the different Wikidata entries to the screen
prettyPrint(wikidataEntries)

# Print each wikidata entry as an object
#for wdEntry in wikidataEntries["search"]:
#   prettyPrint(getItem(site, wdEntry["id"], token))
Run Code Online (Sandbox Code Playgroud)

结果

{   u'search': [   {   u'aliases': [u'Google Inc.'],
                       u'description': u'American multinational Internet and technology corporation',
                       u'id': u'Q95',
                       u'label': u'Google',
                       u'url': u'//www.wikidata.org/wiki/Q95'},
                   {   u'aliases': [u'Google Search', u'Google Web Search'],
                       u'description': u'Internet search engine developed by Google, Inc.',
                       u'id': u'Q9366',
                       u'label': u'Google',
                       u'url': u'//www.wikidata.org/wiki/Q9366'},
                   {   u'description': u'Wikipedia disambiguation page',
                       u'id': u'Q961680',
                       u'label': u'Google',
                       u'url': u'//www.wikidata.org/wiki/Q961680'},
                   {   u'aliases': [u'Google'],
                       u'description': u'verb',
                       u'id': u'Q1156923',
                       u'label': u'google',
                       u'url': u'//www.wikidata.org/wiki/Q1156923'},
                   {   u'id': u'Q10846831',
                       u'label': u'google',
                       u'url': u'//www.wikidata.org/wiki/Q10846831'},
                   {   u'aliases': [u'Google Android'],
                       u'description': u'operating system for mobile devices created by Google',
                       u'id': u'Q94',
                       u'label': u'Android',
                       u'url': u'//www.wikidata.org/wiki/Q94'},
                   {   u'description': u'web browser developed by Google',
                       u'id': u'Q777',
                       u'label': u'Google Chrome',
                       u'url': u'//www.wikidata.org/wiki/Q777'}],
    u'searchinfo': {   u'search': u'Google'},
    u'success': 1}
Run Code Online (Sandbox Code Playgroud)

  • 你省略了 `token = repo.token(pywikibot.Page(repo, 'Main Page'), 'edit')` 和 `def getItem(site, wdItem, token)` 中的位置 `token` 参数,因为你是此时不编辑任何内容(抱歉,我还不能编辑答案,我的声誉还不够)。 (2认同)

daf*_*ana 5

Maybe you can use sparql, to run a query:

SELECT ?item WHERE {
  ?item rdfs:label "Google"@en
}
Run Code Online (Sandbox Code Playgroud)

You can use in python using pywikibot:

 import pywikibot
 from pywikibot import pagegenerators, WikidataBot

 sparql = "SELECT ?item WHERE { ?item rdfs:label 'Google'@en }"
 entities = pagegenerators.WikidataSPARQLPageGenerator(sparql, site=repo)
 entities = list(entities)
Run Code Online (Sandbox Code Playgroud)