相关疑难解决方法(0)

如何在Python 2中发送HEAD HTTP请求？

我在这里尝试做的是获取给定URL的标题,以便我可以确定MIME类型.我希望能够看到是否http://somedomain/foo/会返回HTML文档或JPEG图像.因此,我需要弄清楚如何发送HEAD请求,以便我可以读取MIME类型而无需下载内容.有谁知道这样做的简单方法？

python content-type http http-headers python-2.7

fue*_*sjr

2016 06-27

110
推荐指数

6
解决办法

7万
查看次数

Python检查网站是否存在

我想检查某个网站是否存在,这就是我正在做的事情:

user_agent = 'Mozilla/20.0.1 (compatible; MSIE 5.5; Windows NT)'
headers = { 'User-Agent':user_agent }
link = "http://www.abc.com"
req = urllib2.Request(link, headers = headers)
page = urllib2.urlopen(req).read() - ERROR 402 generated here!

Run Code Online (Sandbox Code Playgroud)

如果页面不存在(错误402,或其他任何错误),我该怎么做page = ...才能确保我正在阅读的页面退出？

html python urlopen

Jam*_*len

2013 05-28

50
推荐指数

7
解决办法

9万
查看次数

Python脚本在没有下载整个页面的情况下查看是否存在网页？

我正在尝试编写一个脚本来测试网页是否存在,如果不下载整个页面就会检查它会很好.

这是我的跳跃点,我已经看到多个示例以相同的方式使用httplib,但是,我检查的每个站点都返回false.

import httplib
from httplib import HTTP
from urlparse import urlparse

def checkUrl(url):
    p = urlparse(url)
    h = HTTP(p[1])
    h.putrequest('HEAD', p[2])
    h.endheaders()
    return h.getreply()[0] == httplib.OK

if __name__=="__main__":
    print checkUrl("http://www.stackoverflow.com") # True
    print checkUrl("http://stackoverflow.com/notarealpage.html") # False

Run Code Online (Sandbox Code Playgroud)

有任何想法吗？

编辑

有人建议这个,但他们的帖子被删除.. urllib2是否避免下载整个页面？

import urllib2

try:
    urllib2.urlopen(some_url)
    return True
except urllib2.URLError:
    return False

Run Code Online (Sandbox Code Playgroud)

python httplib urlparse

som*_*me1

2011 06-25

16
推荐指数

3
解决办法

2万
查看次数

标签统计

python ×3

content-type ×1

html ×1

http ×1

http-headers ×1

httplib ×1

python-2.7 ×1

urlopen ×1

urlparse ×1

如何在Python 2中发送HEAD HTTP请求？

Python检查网站是否存在

Python脚本在没有下载整个页面的情况下查看是否存在网页？

标签 统计

标签统计