Python 的 2.7 socket.timeout 行为

Ant*_*al' 5 python sockets python-2.7

下面是两个简单的python函数。首先尝试连接到test.com666上的域(主机名有效但端口无效)。第二次尝试连接到imap.mail.outlook.com端口 993(主机名有效,但看起来不供公共使用/访问)。

def fn_outlook(timeout):
    try:
        socket.create_connection(("imap.mail.outlook.com", 993), timeout=timeout)
    except socket.timeout:
        pass


def fn_test(timeout):
    try:
        socket.create_connection(("test.com", 666), timeout=timeout)
    except socket.timeout:
        pass
Run Code Online (Sandbox Code Playgroud)

这是该函数具有不同超时的执行时间:

In [14]: %time fn_test(1)
CPU times: user 644 µs, sys: 1.07 ms, total: 1.71 ms
Wall time: 1 s

In [15]: %time fn_test(2)
CPU times: user 589 µs, sys: 1.15 ms, total: 1.74 ms
Wall time: 2 s

In [16]: %time fn_outlook(2)
CPU times: user 838 µs, sys: 2.24 ms, total: 3.08 ms
Wall time: 7.15 s

In [17]: %time fn_outlook(4)
CPU times: user 705 µs, sys: 1.18 ms, total: 1.88 ms
Wall time: 12 s

In [18]: %time fn_test(4)
CPU times: user 483 µs, sys: 795 µs, total: 1.28 ms
Wall time: 4.42 s
Run Code Online (Sandbox Code Playgroud)

对于test.com连接将在timeout参数中指定的~相同时间后超时。但是imap.mail.outlook.com事情变得有趣了——套接字连接忽略了超时参数。准确地说 - 不是忽略,而是总是在更长的时间后超时连接。

我可能认为这种行为源于imap.mail.outlook.com服务器,而不是来自套接字模块。

Cri*_*ati 4

首先,您可以将您的功能统一为:

def fn_connect(host, port, timeout):
    try:
        s = socket.create_connection((host, port), timeout=timeout)
    except socket.timeout:
        return None
    else:
        return s
Run Code Online (Sandbox Code Playgroud)

并这样称呼它们:

IMAP_HOST = "imap.mail.outlook.com"
IMAP_PORT = 993
TEST_HOST = "test.com"
TEST_PORT = 666
s1 = fn_connect(IMAP_HOST, IMAP_PORT, 2)
s2 = fn_connect(TEST_HOST, TEST_PORT, 1)
#and so on....
Run Code Online (Sandbox Code Playgroud)

我返回了套接字以便之后能够正确关闭它(如果not None)。

问题在于底层套接字机制如何解析主机名;create_connection调用getaddrinfo,对于返回的每个地址,它尝试创建一个套接字并连接到它(每个套接字都有您指定的超时时间)。因此,您的 2 个地址的结果:

如您所见,对于IMAP_HOSTIMAP_PORT,它返回 3 个单独的地址(而对于TEST_HOSTTEST_PORT,它只返回 1 个)。由于您指定所有这些都不起作用,因此它将尝试连接到所有这些,从而导致一般超时大约比您指定的超时大 3 倍。