有没有一种从Java字符串中删除HTML的好方法?一个简单的正则表达式
replaceAll("\\<.*?>","")
会工作,但&不会正确转换,两个尖括号之间的非HTML将被删除(即.*?正则表达式将消失).
&
.*?
html java parsing
是否有可以完全删除HTML标记的正则表达式?顺便说一下,我正在使用Java.
html java regex
html ×2
java ×2
parsing ×1
regex ×1