Python - 获取网页的 HTML 源代码

Sdr*_*445 2 python urllib2

我想从站点(例如“example.com”)获取 HTML 源代码。

我尝试了以下方法:

import urllib2

response = urllib2.urlopen("https://example.com")
page_source = response.read()
Run Code Online (Sandbox Code Playgroud)

它说:

'没有名为 urllib2 的模块'

我怎样才能防止这个错误?

Ski*_* Dz 8

为什么不使用请求模块?:

import requests

r = requests.get("https://example.com")
print r.text
Run Code Online (Sandbox Code Playgroud)

或者为了正确回答您的问题,您可以使用 pip 和 easy_install 下载 urllib2 模块:

pip install urllib2
easy_isntall urllib2
Run Code Online (Sandbox Code Playgroud)

对于请求:

pip install requests
easy_install requests
Run Code Online (Sandbox Code Playgroud)

对于 requests ,您应该安装 urllib3:

pip install urllib3
easy_install urllib3
Run Code Online (Sandbox Code Playgroud)