我正在使用Ruby,使用Nokogiri模块,我希望在没有脚本元素的情况下获取正文的内容.
Nokogiri解析使用XPATH或CSS 3.0.XPATH我真的不明白,我找不到CSS选择器来实现我的目标.
小智 8
我不认为使用XPath可以进行这样的选择.
我不熟悉Ruby或Nokogiri,但基于类似问题的答案,您可能想尝试从HTML文档中选择所有脚本元素并将其删除.
doc = Nokogiri::HTML(your_html)
doc.xpath("//script").remove
Run Code Online (Sandbox Code Playgroud)
相应调整.
| 归档时间: |
|
| 查看次数: |
2346 次 |
| 最近记录: |