我试图找出用于将一篇文章拆分成不带标点符号的单词的正则表达式。我尝试按空格分割,但这会给出一些带有标点符号的标记。我还尝试按单词字符分割,由于某种原因它返回了一个空字符串数组:
String[] words = line.split("\\w+");
Run Code Online (Sandbox Code Playgroud)
尝试这个
String[] words = line.split("\\W+");
Run Code Online (Sandbox Code Playgroud)