正则表达式从UTF8字符串中删除非字母数字字符

Tho*_*mas 13 php regex

如何以多字节安全方式从字符串中删除字符,如标点符号,逗号,短划线等?

我将使用来自许多不同语言的输入,我想知道是否有什么东西可以帮助我

谢谢

mar*_*rio 24

你可以使用unicode字符类thingys:

要匹配你可以使用的任何非字母符号\PL+,否定\p{L}.要不删除空格,请使用类似的charclass [^\pL\s]+.或者真的只是删除标点符号\pP+

好吧,显然不要忘记正则表达式/u修饰符.

  • [^\pL\s] +是赢家 (2认同)