什么是我拿的URL是最好的方式:http://foobar.com/foo.torrent并检查是否真的是洪流,而不是一个HTML页面或别的东西有趣.建议?谢谢 :)
我要抓取一个网站获取一些信息.这是大约17万多页.那么,我可以提出多少请求?我将提取直到HTML并获取一些信息.这是一个已经非常受欢迎的网站,所以我不认为如果只是在所有页面上快速巡航就会死亡......只有让我感到紧张的是我不知道自己的用户是否会阻止我的IP或其他东西如果你这样做?这是正常的吗?我应该加载5页/分钟吗?然后它将永远...我希望每24小时获得新数据.
感谢所有回复!
链接到锻炼:
练习5.13,页面底部:231.
我实际上正在挣扎的是,这个符号不是 sigma,而是另一个.那个倍增的人.你会找到xj!我无法看到xj来自哪里!所以当我尝试编程时,我只是......想知道xj假设来自哪里......
非常感谢你的帮助!