有没有一种从Java字符串中删除HTML的好方法?一个简单的正则表达式
replaceAll("\\<.*?>","")
Run Code Online (Sandbox Code Playgroud)
会工作,但&不会正确转换,两个尖括号之间的非HTML将被删除(即.*?正则表达式将消失).
我想从java中的html文件中获取文本
我的html档案是:
<body>
<p>vishal</p>
<strong>patel</strong>
<bold >vishal patel
Run Code Online (Sandbox Code Playgroud)
我想这样输出
vishal
patel
vishal patel
Run Code Online (Sandbox Code Playgroud)
怎么做请帮帮我