gut*_*rie 5 haskell screen-scraping web-scraping
我想在 Haskell 中进行一些屏幕抓取(来自 Netflix),但该站点需要 cookie 登录状态,因此大多数示例使用浏览器自动化要求登录浏览器执行实际的 URL 获取,然后抓取从那个文本。
我想要(在 Ruby 中)的一个很好的例子是:https : //gist.github.com/1425290
有没有什么简单的方法可以从 Haskell 做等效的事情?
我立刻就知道该HTTP软件包Network.Browser支持 cookie,就像curl. 大概http-conduit'sNetwork.HTTP.Conduit.Browser之所以如此命名,是因为它也支持 cookie,尽管我对此不是 100% 有信心。