Tar*_*req 3 php unicode perl utf-8
我正在寻找一个正则表达式将所有非英语和/或阿拉伯语改为下划线"_"
目前我有以下代码可以工作,但我认为我有错误的unicode
范围,因为它允许我的脚本中不需要的中文和其他语言.
$title=~tr/[a-z0-9_\x7f-\xff]/_/cd;
Run Code Online (Sandbox Code Playgroud)
任何帮助,将不胜感激
如果你看到\x7f和之间的字节\xff,你的应用程序可能使用UTF-8字节,而不是Unicode字符.阅读perldoc perlunicode,然后decode()试图在这个层面上与他们合作之前,你的字符串.
完成后,您应该可以搜索英语和阿拉伯语字符,例如:
/[\p{ASCII}\p{Arabic}]/
Run Code Online (Sandbox Code Playgroud)
请参阅perldoc perluniprops您可以使用的其他Unicode属性.