boh*_*ohr 2 java regex string split
我目前正在处理文本处理,并被一个简单的问题分心.我试图根据下划线拆分句子.首先,我想出了一个非常简单的方法:
String[] tokens = taggedSentence.split("_");
Run Code Online (Sandbox Code Playgroud)
它适用于大多数情况,直到我发现文本写成:
Robert_Phd_NNP
但是,我只对POS标签感兴趣,在这种情况下是NNP,但似乎单独用下划线拆分是不够的.然后,我想出了一个想法来获得分句的最后一个元素:
String[] tokens = taggedSentence.split("_");
int tokenSize = tokens.length;
String pos = tokens[tokenSize-1];
Run Code Online (Sandbox Code Playgroud)
但是,我想知道是否有更好的方法(比如正则表达式,也许)这样做.任何评论或建议将非常感激.非常感谢
无需正则表达式即可轻松完成此操作:
String POStag = taggedSentence.substring(taggedSentence.lastIndexOf('_') + 1);
Run Code Online (Sandbox Code Playgroud)
如果没有下划线,则只返回原始字符串.