4 python search
我想编写一个程序来搜索一个相当大的网站并提取某些内容。我有几个在线 Python 课程,但都没有提到如何使用 Python 访问互联网。我不知道我应该从哪里开始。
小智 5
您必须首先阅读标准 python 库urllib2。
一旦您熟悉了这个库背后的基本思想,您就可以尝试更容易与网络交互的请求,尤其是 API。我建议将它与httpie并行使用以从命令行快速测试查询。
如果你更进一步构建一个库或一个引擎来爬网,你将需要某种异步编程,我建议从Gevent开始
最后,如果你想创建一个爬虫/机器人,你可以看看Scrapy。但是,在深入研究这个库之前,您应该从基本库开始,因为它可能会变得非常复杂
归档时间:
13 年,1 月 前
查看次数:
31356 次
最近记录:
8 年,1 月 前