kli*_*ron 3 clojure web-scraping
我正在学习如何使用梦幻般的enlive库来进行网络抓取.我需要捕获一些可能部分突出显示的文本.例如,html可能如下所示:
<a href="example.com" class="usefulLink"><font color="#CC0000">Foo</font> <font color="#CC0000">Bar</font> <font color="#CC0000">Baz</font> <font color="#CC0000">Blah</font>rest of text</a>
Run Code Online (Sandbox Code Playgroud)
使用时的结果(选择页面[:a.usefulLink])很多 {:tag :font :attrs {...} :content {...}}
我的问题是:是否有一种简单的方法可以剔除内容:没有其他所有不必要的内容,或者我是否需要自己做?
你可以用unwrap
.
(-> page
(select [:a.usefulLink])
(at [:font] unwrap))
Run Code Online (Sandbox Code Playgroud)