阿拉伯语的正则表达式

KF2*_*KF2 24 javascript regex

我想写一个匹配句子中每个单词的正则表达式:

我的正则表达式:" \b(\w+)\b"

结果: RegExp匹配阿拉伯图像

虽然它适用于英语单词.使用阿拉伯语单词时不起作用.我怎么能为阿拉伯语单词完成同样的壮举?

Siv*_*ran 41

试试这个:-

function HasArabicCharacters(text)
{
    var arregex = /[\u0600-\u06FF]/;
    alert(arregex.test(text));
} 
Run Code Online (Sandbox Code Playgroud)

阿拉伯字符集的列表

[\u0600-\u06ff]|[\u0750-\u077f]|[\ufb50-\ufc3f]|[\ufe70-\ufefc]
Run Code Online (Sandbox Code Playgroud)

Unicode中的阿拉伯语脚本:

Unicode 6.1开始,阿拉伯语脚本包含在以下块中:

Arabic (0600—06FF, 225 characters)
Arabic Supplement (0750—077F, 48 characters)
Arabic Extended-A (08A0—08FF, 39 characters)
Arabic Presentation Forms-A (FB50—FDFF, 608 characters)
Arabic Presentation Forms-B (FE70—FEFF, 140 characters)
Rumi Numeral Symbols (10E60—10E7F, 31 characters)
Arabic Mathematical Alphabetic Symbols (1EE00—1EEFF, 143 characters)
Run Code Online (Sandbox Code Playgroud)

内容取自维基百科 - Unicode中的阿拉伯语脚本

  • 完全支持[更新的正则表达式](https://gist.github.com/rrshaban/fe18eb4bf3e2cff3a929),如最新的Unicode标准所示:`[\ u0600-\u06ff] | [\ u0750-\u077f] | [\ ufb50-\ufbc1] | [\ ufbd3-\ufd3f] | [\ ufd50-\ufd8f] | [\ ufd92-\ufdc7] | [\ ufe70-\ufefc] | [\ uFDF0-\uFDFD]`.测试一下[关于Rubular](http://rubular.com/r/UC6fwxYhJ7) (2认同)

vah*_*eza 5

我建议这样:

\p{InArabic}
Run Code Online (Sandbox Code Playgroud)