我有这样的正则表达式:
re.compile(r"((https?):((//)|(\\\\))+[\w\d:#@%/;$()~_?\+-=\\\.&]*)", re.MULTILINE|re.UNICODE)
Run Code Online (Sandbox Code Playgroud)
但这不包括hashbangs (#!).我需要改变什么才能让它发挥作用?我知道我可以添加!用#@%etc组合,但是会选择类似的东西
Check this out: http://example.com/something/!!!
Run Code Online (Sandbox Code Playgroud)
而我想避免这种情况.
kin*_*all 10
不要试图为匹配的URL创建自己的正则表达式,使用已解决此类问题的其他人,比如这个.
它可能会很长,但实际上我的效果很好。请试试这个
((http|https)\:\/\/)?[a-zA-Z0-9\.\/\?\:@\-_=#]+\.([a-zA-Z]){2,6}([a-zA-Z0-9\.\&\/\?\:@\-_=#])*
它与下面的所有示例匹配
http://wwww.stackoverflow.com
abc.com
http://test.test-75.1474.stackoverflow.com/
stackoverflow.com/
stackoverflow.com
rfordyce@broadviewnet.com
http://www.example.com/etcetc
www.example.com/etcetc
example.com/etcetc
user:pass@example.com/etcetc
(www.itmag.com)
example.com/etcetc?query=aasd
example.com/etcetc?query=aasd&dest=asds
http://stackoverflow.com/questions/6427530/regular-expression-pattern-to-
match-url-with
www/Christina.V.Scott@gmail.com
line.lundvoll.nilsen@telemed.no.
s.hossain@unsw.edu.au
s.hossain@unsw.edu.au
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
31965 次 |
| 最近记录: |