如何在python中使用正则表达式重新搜索html源代码

Question

如何在python中使用正则表达式重新搜索html源代码

我顶着脑袋却无法解决这个问题.

数字,名字都是虚构的.但这个想法是这样的

我读了一个像'https://graph.facebook.com/123'这样的链接

这导致源代码:

{
   "id": "123",
   "name": "John Doe",
   "first_name": "John",
   "last_name": "Doe",
   "link": "http://www.facebook.com/people/John-Doe/123",
   "gender": "male",
   "locale": "en_US"
}

Run Code Online (Sandbox Code Playgroud)

我想提取id,name等的所有信息.

我试试这个,但它失败了

    link = 'https://graph.facebook.com/123'
    result = browser.open(link)
    text = result.read()
    result.close()
    id = re.search('"id": "(.*?)",', cont)

Run Code Online (Sandbox Code Playgroud)

正则表达式""id":"(.*？)","似乎是正确的,但后面没有返回..为什么???

Answer 1

nos*_*klo 7

这似乎是JSON,你不想使用正则表达式来解析它.

link = 'https://graph.facebook.com/123'
result = browser.open(link)
data = json.load(result)
print data['id']

Run Code Online (Sandbox Code Playgroud)

归档时间：	14 年，10 月前
查看次数：	239 次
最近记录：	14 年，10 月前