gpt4 book ai didi

linux - 为什么套接字连接被阻塞,TCP 内核不断重传 [ACK] 数据包

转载 作者:IT王子 更新时间:2023-10-29 00:36:12 25 4
gpt4 key购买 nike

我们遇到了一个问题,一段时间后,特定的套接字连接被阻塞,客户端的 tcp 内核不断重传 [ACK] 数据包。

拓扑流程如下:

   Client A ←→ Switch A ← Router A:NAT ← .. Internet .. 
→ Router B:NAT → Switch B ←→ Server B

以下是WireShark抓取的数据包:
一)服务器

1. 8013 > 6757 [PSH, ACK] Seq=56 Ack=132 Win=5840 Len=55     
2. 6757 > 8013 [ACK] Seq=132 Ack=111 Win=65425 Len=0

B)客户

//lines 3 and 4 are exactly the same as line 1 and 2      
3. 8013 > 13000 [PSH, ACK] Seq=56 Ack=132 Win=5840 Len=55
4. 13000 > 8013 [ACK] Seq=132 Ack=111 Win=65425 Len=0
5. 13000 > 8013 [PSH, ACK] Seq=132 Ack=111 Win=65425 Len=17

[TCP Retransmission]
6. 13000 > 8013 [PSH, ACK] Seq=132 Ack=111 Win=65425 Len=17

8013 是服务器端口,6757 是客户端 NAT 端口。

为什么TCP内核一直在发送[ACK]数据包告诉客户端它收到数据包 1(见数据包 4、5 和 6),甚至当服务器已经收到一个 [ACK] 数据包时(见数据包 2)?发生问题时,连接的任何一方都不会关闭套接字。

在第 6 个数据包之后,连接丢失了,我们无法发送任何东西到服务器不再通过该套接字。

         psuedocode:  
//client
serverAddr.port =htons(8013) ;
serverAddr.ip = inet_addr(publicIPB);
connect(fdA, serverAddr,...);

//server
listenfd = socket(,SO_STREAM,);
localAddr.port = htons(8013);
localAddr.ip = inet_addr(INADDR_ANY);
bind(localAddr...)
listen(listenfd, 100);

...
//using select model
select(fdSet, NULL, NULL, NULL);
for(...)
{
if (FD_ISSET(listenfd))
{
...
}
...
}

更新
UP1。下面是重现问题的具体步骤

  1. 给定三台计算机,分别是 PC1、PC2 和 PC3。 这三个都在 RouterA 后面,而 Server 在后面 路由器B。

  2. 给定两个用户 U1 和 U2。 U1 从 PC1 登录,U2 从 PC3 登录。两个都 U1 和 U2 将在它们之间建立一个 tcp 连接 和服务器。现在 U1 可以通过它发送数据 tcp 连接到服务器,然后服务器中继所有数据 到 U2。直到这一刻一切正常。

    表示Server对应的socket号 U1 和 Server 之间的 TCP 连接端点: U1-OldSocketFd

  3. 不要注销U1,拔掉PC1的网线。 然后U1从PC2登录,现在建立了一个新的 到服务器的 TCP 连接。

    表示Server对应的socket号 U1 和 Server 之间的 TCP 连接端点: U1-NewSocketFd

    从服务器端,当它更新它的 session 时 对于 U1,它调用 close(U1-OldSocketFd)

4.1。在第 3 步后大约 30 秒,我们发现 U1 IS 无法通过其新的 TCP 向服务器发送任何数据 连接。

4.2。第三步,如果Server没有调用close(U1-OldSocketFd) 立即(U1 之间相同的第二个新连接 并且服务器已建立),相反,服务器调用 close(U1-OldSocketFd) 超过 70-80 秒,然后 一切正常。

UP2。路由器 B 在端口 8013 上使用端口转发。
UP3。 Server运行的Linux操作系统的一些参数。

    net.ipv4.tcp_tw_reuse = 1
net.ipv4.tcp_tw_recycle = 1

最佳答案

在数据包 1(与 3 相同)和 2(与 4 相同)通过后,您的客户端似乎正在向服务器传输 17 个字节的数据(数据包 5)。我不知道在第一次交换数据包之后多长时间后数据包 5 出现,所以我不知道这种情况发生了多长时间。你的伪代码没有阐明它,因为它只显示了套接字初始化,它没有显示哪一方试图在什么时间传输什么数据。 ladder diagram在这种情况下代表您的协议(protocol)交换可能很有用。

无论如何,服务器显然不确认这 17 个字节的数据,因此再次传输它们(数据包 6)。

除非您的网络或防火墙或 NAT 路由器或其他丢弃数据包有问题,否则服务器能够接收 TCP 交换的较早部分但显然无法接收数据包的原因不应该存在5 或 6。再一次,在先前的数据交换和数据包 5 之间是否经过了大量时间(例如,NAT 路由器、防火墙或负载平衡器有足够的时间使连接过期)?

关于linux - 为什么套接字连接被阻塞,TCP 内核不断重传 [ACK] 数据包,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15192309/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com