我需要从字符串'بسماللهالرحمنالرحيم'中删除一些Unicode符号
我知道他们肯定存在于这里.我试过了:
re.sub('([\u064B-\u0652\u06D4\u0670\u0674\u06D5-\u06ED]+)', '', '?????? ??????? ???????????? ??????????')
Run Code Online (Sandbox Code Playgroud)
但它不起作用.字符串保持不变.我究竟做错了什么?
我有一套不同语言的单词(英语,波兰语,芬兰语,俄语等),需要检查一下,用大写字母写的是什么.
我尝试使用简单的正则表达式:^[A-Z],但它只匹配拉丁字母,然后我添加了俄语大写字母:^[A-Z?-?].
但许多带有变音符号的unicode字母仍然存在.我如何将所有大写字母添加到我的正则表达式?
没有枚举符号就可以做到这一点?
PS我知道,如何在Ruby中实现这一点,但现在我正在使用Python.
在.net中你可以\p{L}用来匹配任何字母,我怎样才能在Python中做同样的事情?也就是说,我希望匹配任何大写,小写和重音字母.