Jsoup有效的方法来删除html元素和孩子的

Ser*_*rra 8 html java jsoup

我想删除html divtable表格标签及其中的任何内容(孩子们),最好的方法是什么?

我尝试遍历这样的文档,但它不起作用,在Jsoup文档中它说node.remove()从DOM和他的孩子中删除元素:

doc.traverse(new NodeVisitor() {
                @Override
                public void head(Node node, int i) {

                }

                @Override
                public void tail(Node node, int i) {
                    //Log.i(TAG,"node: "+node.nodeName());
                    if( node.nodeName().compareTo("table") == 0 ||
                            node.nodeName().compareTo("div") == 0 )
                       node.remove();

                }
            });
Run Code Online (Sandbox Code Playgroud)

ash*_*tte 17

您是否尝试过Elements类的remove()功能?

Document doc = Jsoup.parse(html);
doc.select("div").remove();
doc.select("table").remove();
Run Code Online (Sandbox Code Playgroud)

这应该选择并删除所有<div><table>元素.