Pau*_*her 5 javascript unicode text-segmentation
是否有人知道UAX#29,Unicode文本分段的任何JavaScript实现?我对Word Boundaries特别感兴趣.
当我遇到XRegExp时,我很有希望,但它似乎使用了标准的JavaScript实现\b.
https://github.com/orling/grapheme-splitter是UAX #29 Grapheme Cluster Boundaries的纯 js 实现。
还有一个关于使用 UAX #29 实现 Intl.Segmenter 的 ES 提案,请参阅https://github.com/tc39/proposal-intl-segmenter。
| 归档时间: |
|
| 查看次数: |
621 次 |
| 最近记录: |