我正在抓取许多网站的数据,但有些链接永久冻结我的脚本.这不应该发生,因为我使用了这样的超时:
page = requests.get(url,timeout=4)
Run Code Online (Sandbox Code Playgroud)
我希望整个请求超时.因此,当请求需要4秒时,它将停止尝试.我搜索了requests文档,我发现这个代码用于读取和连接超时:
r = requests.get(url, timeout=(3.05, 27))
Run Code Online (Sandbox Code Playgroud)
但是,当我尝试使用它时,我收到类型错误:
Timeout value connect was (3.05, 27), but it must be an int or float.
Run Code Online (Sandbox Code Playgroud)
我怎样才能得到我想要的超时?
我总是让我的字典混乱数据,我在这里做错了什么?
data={
'1': '1',
'2': '2',
'3': '3',
'4': '4',
'5': '5',
'6': '6',
'7': '7',
'8': '8',
'9': '9',
'10': '10',
'11': '11'
}
print data
Run Code Online (Sandbox Code Playgroud)
结果:
{'11': '11', '10': '10', '1': '1', '3': '3', '2': '2', '5': '5', '4': '4', '7':'7', '6': '6', '9': '9', '8': '8'}
Run Code Online (Sandbox Code Playgroud)
我该怎么做才能以正确的顺序获得它?
PS:那个列表只是一个例子我的列表类型更复杂:data = {'str1':'str2','str3':'str4','str5':'str6'....}我怎么能保持他们就像我在第一时间写的那样?使用键:值格式