正则表达式可以使用不同的语言吗?

Joh*_*n K 9 regex unicode internationalization

当然,英语对于正则表达式来说是明智之举,因为它最初是为/开发的:

正则表达式能理解这个字符集吗?

法语进入一些重音字符,我不确定如何匹配 - 即è和e都被正则表达式视为单词字符?

Les表达régulièrespeuventcomprendre ce jeudecaractères?

日语不包含我所知的正则表达式字符以匹配.

正规表现は,この文字を理解でき,设定?

Lar*_*ann 7

简短回答:是的.

更具体地说,它取决于你的正则表达式引擎支持Unicode的比赛(如描述在这里).

这样的匹配会极大地使你的正则表达式复杂化,所以我可以推荐阅读这个 unicode正则表达式教程(同时注意unicode实现本身可能非常混乱,所以你也可以阅读Joel Spolsky 关于字符集内部工作的文章).

  • 请注意,Unicode并不是一团糟.这是所有在它之前的尝试,使整个事情变得混乱. (2认同)