查询维基百科数据页面

gar*_*rak 3 python wikipedia web-crawler

我无法理解维基百科API.

我已经通过处理json来隔离了一个链接,我在向http://en.wikipedia.org/w/api.php发送请求后作为回复

假设我有以下链接,我如何获取出生日期等信息.

我正在使用python.我试过做一个

import urllib2,simplejson
search_req = urllib2.Request(direct_url_to_required_wikipedia_page)
response = urllib2.urlopen(search_req)
Run Code Online (Sandbox Code Playgroud)

我试过读api.但是,我无法弄清楚如何从特定页面中提取数据.

BKo*_*vac 5

尝试:

import urllib
import urllib2
import simplejson

url = 'http://en.wikipedia.org/w/api.php'
values = {'action' : 'query',
          'prop' : 'revisions',
          'titles' : 'Jennifer_Aniston',
          'rvprop' : 'content',
          'format' : 'json'}

data = urllib.urlencode(values)
req = urllib2.Request(url, data)
response = urllib2.urlopen(req)
json = response.read()
Run Code Online (Sandbox Code Playgroud)

变量json是维基百科页面的json.您现在可以使用simplejson或其他任何方法解析它...