JET*_*SEF 1 python regex google-app-engine
好吧,我发现这个正则表达式来自Stack溢出,它可以隔离URL和ID,但是当我试图在app引擎(py)中使用它时,一个错误弹出窗口说"没有什么可重复,我知道Python中有关此正则表达式的错误重复,任何人都可以解决这个问题吗?
File "C:\Program Files\Python27\lib\re.py", line 244, in _compile
raise error, v # invalid expression
error: nothing to repeat
Run Code Online (Sandbox Code Playgroud)
示例代码
# patt = '(?:http:\/\/)?(?:www.)?facebook.com\/(?:(?:\w)*#!\/)?(?:pages\/)?(?:[?\w\-]*\/)?(?:profile.php\?id=(?=\d.*))?([\w\-]*)?'
# tst = self.request.get("form_fbURL")
# m=re.match(patt,tst)
Run Code Online (Sandbox Code Playgroud)
即使我不是一个优秀的python程序员:)
有一个urlparse
解析网址的模块.
该urlparse
模块被重命名为urllib.parse
在Python 3.0
.
$ python
>>> from urlparse import urlparse
>>> urlparse('http://www.facebook.com/hello/world.php?id=789')
ParseResult(scheme='http', netloc='www.facebook.com', path='/hello/world.php', params='', query='id=789', fragment='')
Run Code Online (Sandbox Code Playgroud)