例如我有html:
<div class="item">
<p>
bla bla<br/>
bla bla
</p>
</div>
Run Code Online (Sandbox Code Playgroud)
我需要获得div.item的内部html:
<p>
bla bla<br/>
bla bla
</p>
Run Code Online (Sandbox Code Playgroud)
我知道我可以使用:
doc.css("div.item:first").text
Run Code Online (Sandbox Code Playgroud)
text方法返回没有任何html标签的干净文本
但是我该如何获取div.item的内部html?
尝试:
doc.css("div.item:first").html
Run Code Online (Sandbox Code Playgroud)
但是没有用,文档也没有帮助
有任何想法吗?
所以我<a>在xml文件中有这个标签
<a href="/www.somethinggggg.com">Something 123</a>
Run Code Online (Sandbox Code Playgroud)
我想要的结果是使用Nokogiri并完全删除它的标签,因此它不再是可点击的链接,例如
Something 123
Run Code Online (Sandbox Code Playgroud)
我的尝试:
content = Nokogiri::XML.fragment(page_content)
content.search('.//a').remove
Run Code Online (Sandbox Code Playgroud)
但这也删除了文本.
有关如何使用Nokogiri实现我想要的结果的任何建议?