如何使用 Python 搜索互联网?

4 python search

我想编写一个程序来搜索一个相当大的网站并提取某些内容。我有几个在线 Python 课程,但都没有提到如何使用 Python 访问互联网。我不知道我应该从哪里开始。

小智 5

您必须首先阅读标准 python 库urllib2

一旦您熟悉了这个库背后的基本思想,您就可以尝试更容易与网络交互的请求,尤其是 API。我建议将它与httpie并行使用以从命令行快速测试查询。

如果你更进一步构建一个库或一个引擎来爬网,你将需要某种异步编程,我建议从Gevent开始

最后,如果你想创建一个爬虫/机器人,你可以看看Scrapy。但是,在深入研究这个库之前,您应该从基本库开始,因为它可能会变得非常复杂