JAX实现UAX 29 Unicode文本分段?

Pau*_*her 5 javascript unicode text-segmentation

是否有人知道UAX#29,Unicode文本分段的任何JavaScript实现?我对Word Boundaries特别感兴趣.

当我遇到XRegExp时,我很有希望,但它似乎使用了标准的JavaScript实现\b.

Jun*_*ang 3

https://github.com/orling/grapheme-splitter是UAX #29 Grapheme Cluster Boundaries的纯 js 实现。

还有一个关于使用 UAX #29 实现 Intl.Segmenter 的 ES 提案,请参阅https://github.com/tc39/proposal-intl-segmenter