相关疑难解决方法(0)

如何使用Nokogiri gem获取innerHtml

例如我有html:

<div class="item">
    <p>
        bla bla<br/>
        bla bla
    </p>
</div>
Run Code Online (Sandbox Code Playgroud)

我需要获得div.item的内部html:

 <p>
    bla bla<br/>
    bla bla
 </p>
Run Code Online (Sandbox Code Playgroud)

我知道我可以使用:

doc.css("div.item:first").text
Run Code Online (Sandbox Code Playgroud)

text方法返回没有任何html标签的干净文本

但是我该如何获取div.item的内部html?

尝试:

doc.css("div.item:first").html
Run Code Online (Sandbox Code Playgroud)

但是没有用,文档也没有帮助

有任何想法吗?

parsing ruby-on-rails nokogiri

7
推荐指数
1
解决办法
6573
查看次数

删除标记但保留文本

所以我<a>在xml文件中有这个标签

<a href="/www.somethinggggg.com">Something 123</a>
Run Code Online (Sandbox Code Playgroud)

我想要的结果是使用Nokogiri并完全删除它的标签,因此它不再是可点击的链接,例如

Something 123
Run Code Online (Sandbox Code Playgroud)

我的尝试:

content = Nokogiri::XML.fragment(page_content)
content.search('.//a').remove
Run Code Online (Sandbox Code Playgroud)

但这也删除了文本.

有关如何使用Nokogiri实现我想要的结果的任何建议?

ruby xml xpath nokogiri

1
推荐指数
2
解决办法
2589
查看次数

标签 统计

nokogiri ×2

parsing ×1

ruby ×1

ruby-on-rails ×1

xml ×1

xpath ×1