使用python regex从URL中隔离Facebook URL用户ID

Question

使用python regex从URL中隔离Facebook URL用户ID

JET*_*SEF 1 python regex google-app-engine

好吧,我发现这个正则表达式来自Stack溢出,它可以隔离URL和ID,但是当我试图在app引擎(py)中使用它时,一个错误弹出窗口说"没有什么可重复,我知道Python中有关此正则表达式的错误重复,任何人都可以解决这个问题吗？

  File "C:\Program Files\Python27\lib\re.py", line 244, in _compile
    raise error, v # invalid expression
error: nothing to repeat

Run Code Online (Sandbox Code Playgroud)

示例代码

#   patt = '(?:http:\/\/)?(?:www.)?facebook.com\/(?:(?:\w)*#!\/)?(?:pages\/)?(?:[?\w\-]*\/)?(?:profile.php\?id=(?=\d.*))?([\w\-]*)?'
#   tst = self.request.get("form_fbURL")
#   m=re.match(patt,tst)

Run Code Online (Sandbox Code Playgroud)

即使我不是一个优秀的python程序员:)

Answer 1

kev*_*kev 7

有一个urlparse解析网址的模块.
该urlparse模块被重命名为urllib.parse在Python 3.0.

$ python
>>> from urlparse import urlparse
>>> urlparse('http://www.facebook.com/hello/world.php?id=789')
ParseResult(scheme='http', netloc='www.facebook.com', path='/hello/world.php', params='', query='id=789', fragment='')

Run Code Online (Sandbox Code Playgroud)

归档时间：	14 年，2 月前
查看次数：	882 次
最近记录：	14 年，2 月前