假设您的源数据是UTF-8编码的
$input = "???? ??????? O?? ?O?? ?????? ????";
preg_match_all( "/[\\x{0590}-\\x{05FF}]+/u", $input, $matches );
echo '<pre>';
print_r( $matches );
echo '</pre>';
Run Code Online (Sandbox Code Playgroud)
产量
Array
(
[0] => Array
(
[0] => ????
[1] => ???????
[2] => ??
[3] => ?
[4] => ??
[5] => ??????
[6] => ????
)
)
Run Code Online (Sandbox Code Playgroud)
我在此Unicode图表上基于0590到05FF的范围(编辑:在这里找到更好的希伯来语/ unicode信息).我用它来生成我的样本输入.由于我不知道希伯来语,我实际上无法验证匹配的输出是否有效.
您可能需要调整它,但希望这会让您朝着正确的方向前进.
感谢您的所有回答,
\n\n对我有用的是 preg_match("/^\\p{Hebrew}+$/u", "\xd7\xa9\xd7\x9c\xd7\x95\xd7\x9d");
\n