正则表达式帮助 - 清理空白 - Java

Eri*_*son 2 java regex

我试图以合理的方式查看HTML文件的文本.删除所有标记并仅保留可见文本后,我获得一个类似于下面的字符串:

\n\n\n\n \n\n\n \n\n \n Title here \n\n\n \n\n \n\n Menu Item 1 \n\n \n\n Menu Item 2 \n\n\n \n\n you get the       point.
Run Code Online (Sandbox Code Playgroud)

我想用String.replaceAll(String regex, String regex)更换一个包含两个以上occurances任何空格子\n"\n\n".

有任何想法吗?

**编辑:**

抱歉缺乏精确度.我希望上面的文字改为:

\n\nTitle here\n\nMenu Item 1\n\nMenu Item 2\n\nyou get the       point.
Run Code Online (Sandbox Code Playgroud)

我想要任何只有空格的子字符串,并且包含两个以上的换行符"\n\n".

jjn*_*guy 5

str.replaceAll("\\s*\n\\s*\n\\s*\n\\s*", "\n\n")
Run Code Online (Sandbox Code Playgroud)

这将替换包含2个以上的任何whitespace-substring \n并将其替换为\n\n.

我总是使用的Java正则表达式引用位于此处.它应该可以帮助您将来构建正则表达式.