Python正则表达式'\ s'与unicode BOM(U + FEFF)不匹配

use*_*609 9 python regex unicode

Python re模块的文档说,当设置re.UNICODE标志时,'\s'将匹配:

在Unicode字符属性数据库中被分类为空格的任何内容.

据我所知,BOM(U + FEFF)被归类为空间.

然而:

re.match(u'\s', u'\ufeff', re.UNICODE)
Run Code Online (Sandbox Code Playgroud)

评估为None.

这是Python中的错误还是我错过了什么?

Ste*_*fan 13

根据unicode数据库,U + FEFF不是空格字符.

维基百科只列出它,因为它是一个"相关角色".它们类似于空白字符,但WSpace在数据库中没有该属性.

这些字符都不匹配\s.