在Python中,如何列出POSIX扩展正则表达式匹配的所有字符[:space:]?
是否有一种编程方式来提取所涵盖的Unicode代码点[:space:]?
通常,人们希望列出给定Unicode类别中的所有字符.例如:
通过迭代所有Unicode代码点并测试所需类别(Python 3),可以生成此列表:
[c for c in map(chr, range(0x110000)) if unicodedata.category(c) in ('Ll',)]
Run Code Online (Sandbox Code Playgroud)
或使用正则表达式,
re.findall(r'\s', ''.join(map(chr, range(0x110000))))
Run Code Online (Sandbox Code Playgroud)
但这些方法很慢.有没有办法在类别中查找字符列表而不必遍历所有字符?
与Perl相关的问题:如何获取具有给定属性的所有Unicode字符的列表?