java 正则表达式 任何单词

Huk*_*ABA 5 java regex

我试图找出用于将一篇文章拆分成不带标点符号的单词的正则表达式。我尝试按空格分割,但这会给出一些带有标点符号的标记。我还尝试按单词字符分割,由于某种原因它返回了一个空字符串数组:

String[] words = line.split("\\w+");
Run Code Online (Sandbox Code Playgroud)

Evg*_*eev 4

尝试这个

String[] words = line.split("\\W+");
Run Code Online (Sandbox Code Playgroud)

  • 有趣的。我在脑海中知道 \W 并认为首先使用 \s+,然后感到困惑并搞乱了 split 的定义并使用了 \w+,并且没有意识到使用相反的。 (2认同)