这是个问题.
给定网址http://www.example.com,我们可以读取页面外的前N个字节吗?
使用curl,有-r,0-499指定前500个字节.似乎解决了这个问题.
您还应该知道许多HTTP/1.1服务器没有启用此功能,因此当您尝试获取范围时,您将获得整个文档.
在python中使用urlib.类似的问题在这里,但根据康斯坦丁的评论,这是真的吗?
上次我尝试这种技术时失败了,因为实际上不可能只从HTTP服务器读取指定数量的数据,即你隐式读取所有HTTP响应,然后只读出它的前N个字节.所以最后你最终下载了整个1Gb恶意响应.
所以问题是我们如何在实践中从HTTP服务器读取前N个字节?
问候和谢谢