use*_*609 9 python regex unicode
Python re模块的文档说,当设置re.UNICODE标志时,'\s'将匹配:
在Unicode字符属性数据库中被分类为空格的任何内容.
据我所知,BOM(U + FEFF)被归类为空间.
然而:
re.match(u'\s', u'\ufeff', re.UNICODE)
Run Code Online (Sandbox Code Playgroud)
评估为None.
这是Python中的错误还是我错过了什么?
Ste*_*fan 13
根据unicode数据库,U + FEFF不是空格字符.
维基百科只列出它,因为它是一个"相关角色".它们类似于空白字符,但WSpace在数据库中没有该属性.
这些字符都不匹配\s.
| 归档时间: |
|
| 查看次数: |
572 次 |
| 最近记录: |