相关疑难解决方法(0)

是否有所有国际句号标点的字符集?

我试图将utf-8字符串解析成"一口大小"的段.例如,我想将文本分解为"句子".

是否有一个全面的字符集(或正则表达式)对应于所有语言的句子结尾?我正在寻找可以捕捉拉丁时期,感叹号和审讯标记,中国和日本句号等的东西.

像上面这样的东西,但相当于一个逗号也会很棒.

unicode parsing character-encoding punctuation string-parsing

7
推荐指数
2
解决办法
1188
查看次数