我正在读一本书,看到这样的大量例子:
(?P<email>
[\w\d.+-]+ # username
@
([\w\d.]+\.)+ # domain name prefix
(com|org|edu) # limit the allowed top-level domains
)
Run Code Online (Sandbox Code Playgroud)
因为\w手段[a-zA-Z0-9_],\d手段[0-9],\d是子集\w.
那么,那些"\ d"不是多余的吗?请有人确认我的理解是正确的,因为这会让我感到困惑.
是的,这是多余的,普通\w也可以.请参阅https://docs.python.org/2/library/re.html
\d当
UNICODE未指定标志,匹配任何十进制数字; 这相当于集合[0-9].使用时UNICODE,它将匹配Unicode字符属性数据库中分类为十进制数字的任何内容.
\w如果未指定
LOCALE和UNICODE标志,则匹配任何字母数字字符和下划线; 这相当于集合[a-zA-Z0-9_].使用时LOCALE,它将匹配集合[0-9_]以及为当前区域设置定义为字母数字的任何字符.如果UNICODE设置,则将匹配字符[0-9_]加上Unicode字符属性数据库中分类为字母数字的内容.
| 归档时间: |
|
| 查看次数: |
121 次 |
| 最近记录: |