小编Jon*_*aid的帖子

使用正则表达式识别和隔离希伯来语单词

我需要解析一个希伯来语句子来识别和隔离(这样我就可以用“span”标签将它们包裹起来)其中的每个单词。\n我首先尝试通过从空格字符中识别非空格字符来不使用标点符号,但仍然不起作用:

\n\n
var regex = /(\\s)*(\\S)+(\\s)*/g;\n
Run Code Online (Sandbox Code Playgroud)\n\n

有什么想法吗?\n谢谢

\n\n

编辑:我已经有一个用英语完成工作的正则表达式,我把它放在以防万一它可以帮助理解我想要实现的目标:

\n\n
var regExp = /\\b([^\\s\']+)\\b/g,\n
Run Code Online (Sandbox Code Playgroud)\n\n

edit2:添加代码示例

\n\n
var regex = /(\\s)*(\\S)+(\\s)*/g;\nvar sentence = "\xd7\xa9\xd7\x9c\xd7\x95\xd7\x9d \xd7\x9e\xd7\x94 \xd7\xa7\xd7\x95\xd7\xa8\xd7\x94 \xd7\x9e\xd7\x94\xd7\x99\xd7\x95\xd7\x9d";\nsentence.replace(regex, function(match, p1, p2, p3){console.log(\'"\' + match + \'"\', \'"\' + p1 + \'"\', \'"\' + p2 + \'"\', \'"\' + p3 + \'"\');});\n\n\n// result\n"\xd7\xa9\xd7\x9c\xd7\x95\xd7\x9d " "undefined" "\xd7\x9d" " " VM1494:2\n"\xd7\x9e\xd7\x94 " "undefined" "\xd7\x94" " " VM1494:2\n"\xd7\xa7\xd7\x95\xd7\xa8\xd7\x94 " "undefined" "\xd7\x94" " " VM1494:2\n"\xd7\x94\xd7\x99\xd7\x95\xd7\x9d" "undefined" "\xd7\x9d" "undefined" VM1494:2\n"undefinedundefinedundefinedundefined"\n
Run Code Online (Sandbox Code Playgroud)\n\n

edit3:我需要能够在末尾使用相同的标点符号重新组合句子。

\n

javascript regex hebrew right-to-left

5
推荐指数
1
解决办法
1384
查看次数

标签 统计

hebrew ×1

javascript ×1

regex ×1

right-to-left ×1