我有一段时间以来试图想方设法用C++做一些简单的网站抓取.我偶然发现了cURL库,但我无法正确安装,所以我会尝试另一种方法.
你们有谁知道任何方法吗?如果后面详细解释如何使用C++在Win32上安装它,那么使用cURL是一个可以接受的答案.
我可以在某种程度上更容易地做到这一点,还是在C++中是不可能的任务?如果是这样,冒险使用C#会更容易吗,虽然我之前从未使用过它?
正如Vlad Lazarenko发表的评论,cURL的官方安装指南可以帮助您安装它.
当你仍然无法使它工作时,你总是可以自己实现HTTP.这不是一个非常复杂的协议.您只需使用Winsock创建套接字,连接到端口80上的Web服务器,然后发送以下字符串:
"GET /example.html HTTP/1.1\r\n"
"Host: www.example.com\r\n"
"\r\n"
Run Code Online (Sandbox Code Playgroud)
并且网络服务器将使用自己的HTTP标头回答,然后是example.html的内容(或错误消息).
关于你关于C#的问题:当我不得不选择在C++或C#中实现web scraper时,我会选择后者,因为它带有HTTP支持和开箱即用的更优越的字符串处理功能,而不需要任何库.但这是假设1.我和我的团队同样对两种语言都有所了解.2.没有任何要求我不知道哪些更倾向于C++.