And*_*rei 4 javascript regex unicode word-boundary xregexp
是否有解决方案在日语字符串中找到单词边界(例如:"私はマーケットに行きました.")通过JavaScript正则表达式("xregexp"JS库cab使用)?
例如:
var xr = RegExp("\\bst","g");
xr.test("The string") // --> true
Run Code Online (Sandbox Code Playgroud)
我需要日语字符串的相同逻辑.
然而,将日语句子分成单词的实际问题比看起来更复杂,因为单词不像例如英语那样被分成空格.
例如,句子私はマーケットに行きました.("我去市场")有以下几个字:
除了其他方面之外,日语句子的可靠解析器必须找到粒子(wa和ni)在句子中的位置,以便找到剩余的单词.