相关疑难解决方法(0)

Python和带有Unicode的正则表达式

我需要从字符串'بسماللهالرحمنالرحيم'中删除一些Unicode符号

我知道他们肯定存在于这里.我试过了:

re.sub('([\u064B-\u0652\u06D4\u0670\u0674\u06D5-\u06ED]+)', '', '?????? ??????? ???????????? ??????????')
Run Code Online (Sandbox Code Playgroud)

但它不起作用.字符串保持不变.我究竟做错了什么?

python regex character-properties

81
推荐指数
2
解决办法
8万
查看次数

用于unicode大写单词的Python正则表达式

我有一套不同语言的单词(英语,波兰语,芬兰语,俄语等),需要检查一下,用大写字母写的是什么.

我尝试使用简单的正则表达式:^[A-Z],但它只匹配拉丁字母,然后我添加了俄语大写字母:^[A-Z?-?].

但许多带有变音符号的unicode字母仍然存在.我如何将所有大写字母添加到我的正则表达式?

没有枚举符号就可以做到这一点?

PS我知道,如何在Ruby中实现这一点,但现在我正在使用Python.

python regex python-2.7 python-3.x

12
推荐指数
2
解决办法
3279
查看次数

匹配任何unicode信件?

在.net中你可以\p{L}用来匹配任何字母,我怎样才能在Python中做同样的事情?也就是说,我希望匹配任何大写,小写和重音字母.

python regex character-properties

10
推荐指数
2
解决办法
5626
查看次数