Tom*_*son 13 linux system-calls tcp timeout socket
在 Linux 上(我的实时服务器在 RHEL 5.5 上 - 下面的 LXR 链接指向内核版本),man 7 ip
说:
已绑定的 TCP 本地套接字地址在关闭后的一段时间内不可用,除非设置了 SO_REUSEADDR 标志。
我没有使用SO_REUSEADDR
. “一段时间”是多长时间?我怎样才能知道它有多长,我怎样才能改变它?
我一直在谷歌上搜索这个,并找到了一些信息,但没有一个能从应用程序程序员的角度真正解释这一点。以机智:
net/tcp.h
是“要等待多久才能破坏TIME-WAIT状态”,固定为“大约60秒”我绊倒的地方在于弥合内核的 TCP 生命周期模型和程序员的端口不可用模型之间的差距,即理解这些状态与“一段时间”的关系。
Bru*_*ger 15
我相信套接字对程序不可用的想法是允许任何仍在传输中的 TCP 数据段到达,并被内核丢弃。也就是说,应用程序可以调用close(2)
套接字,但路由延迟或事故来控制数据包或您可以允许 TCP 连接的另一端发送数据一段时间。应用程序表明它不再想处理 TCP 数据段,所以内核应该在它们进来时丢弃它们。
我用 C 编写了一个小程序,您可以编译并使用它来查看超时时间:
#include <stdio.h> /* fprintf() */
#include <string.h> /* strerror() */
#include <errno.h> /* errno */
#include <stdlib.h> /* strtol() */
#include <signal.h> /* signal() */
#include <sys/time.h> /* struct timeval */
#include <unistd.h> /* read(), write(), close(), gettimeofday() */
#include <sys/types.h> /* socket() */
#include <sys/socket.h> /* socket-related stuff */
#include <netinet/in.h>
#include <arpa/inet.h> /* inet_ntoa() */
float elapsed_time(struct timeval before, struct timeval after);
int
main(int ac, char **av)
{
int opt;
int listen_fd = -1;
unsigned short port = 0;
struct sockaddr_in serv_addr;
struct timeval before_bind;
struct timeval after_bind;
while (-1 != (opt = getopt(ac, av, "p:"))) {
switch (opt) {
case 'p':
port = (unsigned short)atoi(optarg);
break;
}
}
if (0 == port) {
fprintf(stderr, "Need a port to listen on\n");
return 2;
}
if (0 > (listen_fd = socket(AF_INET, SOCK_STREAM, 0))) {
fprintf(stderr, "Opening socket: %s\n", strerror(errno));
return 1;
}
memset(&serv_addr, '\0', sizeof(serv_addr));
serv_addr.sin_family = AF_INET;
serv_addr.sin_addr.s_addr = htonl(INADDR_ANY);
serv_addr.sin_port = htons(port);
gettimeofday(&before_bind, NULL);
while (0 > bind(listen_fd, (struct sockaddr *)&serv_addr, sizeof(serv_addr))) {
fprintf(stderr, "binding socket to port %d: %s\n",
ntohs(serv_addr.sin_port),
strerror(errno));
sleep(1);
}
gettimeofday(&after_bind, NULL);
printf("bind took %.5f seconds\n", elapsed_time(before_bind, after_bind));
printf("# Listening on port %d\n", ntohs(serv_addr.sin_port));
if (0 > listen(listen_fd, 100)) {
fprintf(stderr, "listen() on fd %d: %s\n",
listen_fd,
strerror(errno));
return 1;
}
{
struct sockaddr_in cli_addr;
struct timeval before;
int newfd;
socklen_t clilen;
clilen = sizeof(cli_addr);
if (0 > (newfd = accept(listen_fd, (struct sockaddr *)&cli_addr, &clilen))) {
fprintf(stderr, "accept() on fd %d: %s\n", listen_fd, strerror(errno));
exit(2);
}
gettimeofday(&before, NULL);
printf("At %ld.%06ld\tconnected to: %s\n",
before.tv_sec, before.tv_usec,
inet_ntoa(cli_addr.sin_addr)
);
fflush(stdout);
while (close(newfd) == EINTR) ;
}
if (0 > close(listen_fd))
fprintf(stderr, "Closing socket: %s\n", strerror(errno));
return 0;
}
float
elapsed_time(struct timeval before, struct timeval after)
{
float r = 0.0;
if (before.tv_usec > after.tv_usec) {
after.tv_usec += 1000000;
--after.tv_sec;
}
r = (float)(after.tv_sec - before.tv_sec)
+ (1.0E-6)*(float)(after.tv_usec - before.tv_usec);
return r;
}
Run Code Online (Sandbox Code Playgroud)
我在 3 台不同的机器上尝试了这个程序,当内核拒绝允许非 root 用户重新打开套接字时,我得到了一个可变的时间,在 55 到 59 秒之间。我将上面的代码编译成一个名为“opener”的可执行文件,并像这样运行它:
./opener -p 7896; ./opener -p 7896
Run Code Online (Sandbox Code Playgroud)
我打开另一个窗口并执行以下操作:
telnet otherhost 7896
Run Code Online (Sandbox Code Playgroud)
这会导致“opener”的第一个实例接受一个连接,然后关闭它。“opener”的第二个实例每秒尝试访问bind(2)
TCP 端口 7896。"opener" 报告 55 到 59 秒的延迟。
谷歌搜索,我发现人们建议这样做:
echo 30 > /proc/sys/net/ipv4/tcp_fin_timeout
Run Code Online (Sandbox Code Playgroud)
以减少该间隔。它对我不起作用。在我可以访问的 4 台 linux 机器中,两台有 30 台,两台有 60 台。我还将该值设置为低至 10。与“opener”程序没有区别。
这样做:
echo 1 > /proc/sys/net/ipv4/tcp_tw_recycle
Run Code Online (Sandbox Code Playgroud)
确实改变了事情。第二个“开瓶器”只用了大约 3 秒钟就得到了它的新插座。