我试图以合理的方式查看HTML文件的文本.删除所有标记并仅保留可见文本后,我获得一个类似于下面的字符串:
\n\n\n\n \n\n\n \n\n \n Title here \n\n\n \n\n \n\n Menu Item 1 \n\n \n\n Menu Item 2 \n\n\n \n\n you get the point.
Run Code Online (Sandbox Code Playgroud)
我想用String.replaceAll(String regex, String regex)更换一个包含两个以上occurances任何空格子\n带"\n\n".
有任何想法吗?
**编辑:**
抱歉缺乏精确度.我希望上面的文字改为:
\n\nTitle here\n\nMenu Item 1\n\nMenu Item 2\n\nyou get the point.
Run Code Online (Sandbox Code Playgroud)
我想要任何只有空格的子字符串,并且包含两个以上的换行符"\n\n".
str.replaceAll("\\s*\n\\s*\n\\s*\n\\s*", "\n\n")
Run Code Online (Sandbox Code Playgroud)
这将替换包含2个以上的任何whitespace-substring \n并将其替换为\n\n.
我总是使用的Java正则表达式引用位于此处.它应该可以帮助您将来构建正则表达式.
| 归档时间: |
|
| 查看次数: |
384 次 |
| 最近记录: |