Rom*_*man 6 java regex string comparison tokenize
我不小心回答了一个问题,原始问题涉及将句子分成单独的单词.
作者建议使用BreakIterator标记输入字符串,有些人喜欢这个想法.
我只是没有那么疯狂:25行复杂代码如何比带有regexp的简单单行程更好?
请解释一下使用BreakIterator的优点以及应该使用它的真实案例.
如果它真的很酷,那么我想知道:你真的BreakIterator在你的项目中使用这种方法吗?
它BreakIterator提供了一些很好的显式控制,并以嵌套的方式干净地迭代每个句子和单词。我不熟悉指定区域设置对您的确切作用,但我确信它有时也很有帮助。
我一点也不觉得复杂。只需为句子级别设置一个迭代器,为单词级别设置另一个迭代器,将单词第一个嵌套在第二个单词内。
如果问题发生了变化,那么您在其他问题上的解决方案可能就消失了。然而,这种迭代句子和单词的模式可以起到很多作用。
这样的名单还在继续……
| 归档时间: |
|
| 查看次数: |
2162 次 |
| 最近记录: |