相关疑难解决方法(0)

我需要从字符串'بسماللهالرحمنالرحيم'中删除一些Unicode符号

我知道他们肯定存在于这里.我试过了:

re.sub('([\u064B-\u0652\u06D4\u0670\u0674\u06D5-\u06ED]+)', '', '?????? ??????? ???????????? ??????????')

但它不起作用.字符串保持不变.我究竟做错了什么？

81
推荐指数

2
解决办法

8万
查看次数

我有一套不同语言的单词(英语,波兰语,芬兰语,俄语等),需要检查一下,用大写字母写的是什么.

我尝试使用简单的正则表达式:^[A-Z],但它只匹配拉丁字母,然后我添加了俄语大写字母:^[A-Z?-?].

但许多带有变音符号的unicode字母仍然存在.我如何将所有大写字母添加到我的正则表达式？

没有枚举符号就可以做到这一点？

PS我知道,如何在Ruby中实现这一点,但现在我正在使用Python.

12
推荐指数

2
解决办法

3279
查看次数

在.net中你可以\p{L}用来匹配任何字母,我怎样才能在Python中做同样的事情？也就是说,我希望匹配任何大写,小写和重音字母.

10
推荐指数

2
解决办法

5626
查看次数