我正在从网址抓取一段文本,并希望删除有一个backtotop类的段落下面的所有内容.我在stackoverflow上看到了一个遍历代码片段看起来很有希望,但我无法弄清楚如何将它合并到一起,所以@el只包含p.backtotopdiv中第一个的所有内容.
我的代码:
@doc = Nokogiri::HTML(open(url))
@el = @doc.css("div")[0]
end
Run Code Online (Sandbox Code Playgroud)
遍历代码段:
doc = Nokogiri::HTML(code)
stop_node = doc.css("p.backtotop")
doc.traverse do |node|
break if node == stop_node
# else, do whatever, e.g. `puts node.name`
end
Run Code Online (Sandbox Code Playgroud)