如何从字符串中删除所有非字母(所有语言)和非数字字符?

Phi*_*hil 4 python regex python-2.7

我一直在寻找相当长的一段时间但我找不到任何关于这个问题的解释.

如果我有一个字符串,请说:u'àaeëß35+{}"´'.我希望删除所有非字母数字字符(但是,我想à, ë, ß保留等等).

我是Python的新手,我无法找出执行此任务的正则表达式.只有我能想到的其他解决方案是拥有一个列表,其中包含我要删除的字符,并通过替换它们的字符串进行迭代.

什么是正确的Pythonic解决方案?

谢谢.

roo*_*oot 9

In [63]: s = u'àaeëß35+{}"´'

In [64]: print ''.join(c for c in s if c.isalnum())
àaeëß35
Run Code Online (Sandbox Code Playgroud)