gpt4 book ai didi

linux - ARP 表在 send() 调用期间/期间更改的影响

转载 作者:塔克拉玛干 更新时间:2023-11-03 01:25:44 25 4
gpt4 key购买 nike

an issue we're having 开始,我试图了解当进程忙于使用重复调用将数据(数千个 UDP 视频数据包 + 偶尔的 TCP 消息)写入套接字时 ARP 表更改的影响/影响 send() .

似乎,无论出于何种原因,我们的进程(更准确地说:Live555 WIS-Streamer 的进程)被此事件绊倒/阻塞。

任何人都可以帮助我了解在这种情况下可能发生的情况 - 我们可能期望/从 send() 捕获的错误/返回状态是什么? ,我们如何在我们的代码中缓解这种情况?

我目前正在阅读题为 Understanding Linux network Internals 的信息手册(只有 1035 页)但是任何有助于加速调试过程的提示都非常感谢!

编辑添加:我不希望人们认为我忽略了有关端口状态或进程状态的问题,这个问题很少发生(平均每 24 小时一次)并且只发生在一个我们无法轻易访问的(远程)安装,我们正在努力在实验室中复制它,以便我们可以进行更详细的诊断,但系统看门狗会在问题发生后约 3 分钟内重置,所以到时候消息传到我们这里,它已经重新启动并开始正常工作。

编辑以添加 Wireshark 信息:我不确定在这里总结 wireshark 捕获的最佳方法(很难上传 ~1Tb 的捕获数据包!)但我会尝试。 Cam:X & Cam:Y是由两个相同的 Live555 WIS Streamer 实例从不同端口流式传输的两个 RTSP 视频流。服务器'A'和'B'是服务器上两个网卡的MAC。

数据包的顺序是这样的:

UDP Packet from Cam:X -> Server 'A'
UDP Packet from Cam:Y -> Server 'A'
UDP Packet from Cam:X -> Server 'A'
UDP Packet from Cam:Y -> Server 'A'
UDP Packet from Cam:X -> Server 'A'
UDP Packet from Cam:Y -> Server 'A'
ARP Packet to Cam from Server 'B' "<my IP> is now on 'B'"
Intel ANS Probe broadcast from Server 'B', Sender ID '1' team ID 'B'
Intel ANS Probe broadcast from Server 'A', Sender ID '2' team ID 'B'
<silence> from Cam:X
UDP Packet from Cam:Y -> Server 'B'
UDP Packet from Cam:Y -> Server 'B'
UDP Packet from Cam:Y -> Server 'B'

此时或前后流中没有其他数据包。英特尔 ANS 数据包并不总是与来自 NIC 的 ARP 一致,但我认为为了完整性起见我应该将它们包括在内。

这个问题似乎对时间非常敏感,我们定期从服务器看到这些“团队”ARP,而且它们给我们带来问题的机会只有一次——好像网络堆栈代码中有一个特定的点是对 ARP 表变化敏感。失败的并不总是同一个流实例,尤其是另一个实例(以及所有其他网络流量 - HTTP 等)继续正常工作。

这听起来像是成组的 NIC“不应该”像这个 session 中期那样的 ARP,但是当流量全是 UDP 时,它们当然不会知道任何 session 。

最佳答案

好吧,如果只是给一些closure为此,客户重新配置了他们不可靠的网卡,一切正常,所以不幸的是,对于好奇的人来说,这意味着没有人会花钱让任何人仔细研究可以做些什么来解决这个问题。

关于linux - ARP 表在 send() 调用期间/期间更改的影响,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35437799/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com