我想删除html div和table表格标签及其中的任何内容(孩子们),最好的方法是什么?
我尝试遍历这样的文档,但它不起作用,在Jsoup文档中它说node.remove()从DOM和他的孩子中删除元素:
doc.traverse(new NodeVisitor() {
@Override
public void head(Node node, int i) {
}
@Override
public void tail(Node node, int i) {
//Log.i(TAG,"node: "+node.nodeName());
if( node.nodeName().compareTo("table") == 0 ||
node.nodeName().compareTo("div") == 0 )
node.remove();
}
});
Run Code Online (Sandbox Code Playgroud)
ash*_*tte 17
您是否尝试过Elements类的remove()功能?
Document doc = Jsoup.parse(html);
doc.select("div").remove();
doc.select("table").remove();
Run Code Online (Sandbox Code Playgroud)
这应该选择并删除所有<div>和<table>元素.
| 归档时间: |
|
| 查看次数: |
7903 次 |
| 最近记录: |