Bo *_*ich 36 .net c# browser automation web-scraping
我是一名正在构建GUI Web抓取应用程序的Python开发人员.最近我决定迁移到.NET框架并在C#中编写相同的应用程序(这个决定不是我的).
在Python中,我使用了Mechanize库.但是,我似乎无法在.NET中找到类似的东西.我需要的是一个以无头模式运行的浏览器,它能够填写表单,提交表单等.JavaScript解析器不是必须的,但它会非常有用.
Yah*_*hia 32
有一些选择:
WebKit.Net(免费)
Awesomium
它基于Chrome/WebKit,就像一个魅力.有免费许可证,但也有商业许可证,如果需要,你可以购买源代码:-)
HTML Agility Pack(免费)
这有助于从HTML等中提取信息,可能对您的情况有用(可能与之结合使用HttpWebRequest
)
您可能正在使用TrifleJS(当前为beta),或使用.NET WebBrowser类(通过无窗口ActiveX / COM API与IE通信)进行类似操作。
本质上,您将使用Internet Explorer的Trident引擎运行完整的浏览器(而不是http请求包装器),如果您对JavaScript API(phantomjs的端口)不感兴趣,则仍然可以使用某些C#代码库避开关键概念(自定义标题,Cookie,脚本执行,屏幕截图渲染等)。
请注意,这还可以模拟IE的不同版本,具体取决于您所安装的版本。
归档时间: |
|
查看次数: |
39444 次 |
最近记录: |