gpt4 book ai didi

go - 如何检测 TCPConn 是否存活

转载 作者:行者123 更新时间:2023-12-01 22:39:24 27 4
gpt4 key购买 nike

我有几个 TCPConn 对象。我想运行 goroutine,它会定期检查我的 TCPConns 是否还活着,如果有人死了,我想关闭这些 TCPConn 并从内存中删除。

如何检查 TCPConn 对象是否存在?我没有在 net lib docs 中找到类似的方法。

最佳答案

你显然不能。

但这原则上与 Go 无关,而是关于 TCP/IP。

为什么你不能有多个方面:

  • 这样的检查——如果存在的话——本质上是活泼的:例如,一旦检查返回“一切正常”,远程端就可以向你发送一个带有 RST 的数据包。 .

    这很像在尝试读取文件之前检查文件系统上的文件是否存在:一旦检查询问文件系统文件是否存在,并且它回答"is",任何其他进程都可以删除该文件,因此尝试打开相信存在的文件将失败。

    还要考虑一个完全可行的可能性,即您的进程与系统中运行的其他进程竞争 CPU 时间:当内核剥夺您的进程的 CPU 时,您的程序代码中看起来像两个相邻的操作可能被许多挂钟时间分开时间,无论什么原因。
  • 流行内核的 TCP/IP 堆栈不会公开“TCP 连接健康”的概念。

    例如,假设您已经向远程端发送了几个字节,并且本地系统上的 TCP 堆栈等待听到远程 TCP 堆栈确认它们的接收。
    您无法让 TCP 堆栈告诉您的用户空间代码似乎“停止”了某些东西。

    远程端的情况更糟:如果远程方试图向您发送一些东西并且由于某种原因而停止,它根本无法将这个事实传达给您:因为通信链接毕竟是停止的,所以没有通信是可能的。


  • 仍然存在几种方法来解决这个问题。
  • 在您的应用程序级协议(protocol)中实现“pings”(“heartbeats”——正如@Adrian 在他们的评论中所建议的——是此类功能的另一个流行名称)。

    比如说,如果参与通信的一方在指定的时间段内没有发送任何信息,它必须发送一些“ping”消息,然后期望远程端用“pong”消息回复它,这应该发生在配置的时间范围内;如果 pong 没有在该时间范围内到达,您认为通信链接已损坏。
  • 在您的连接上启用 TCP keepalives — 通过使用它的 net.TCPConn.SetKeepalive* methods - 并依靠他们主动检测通信中断。

    如果连接处于空闲状态,此机制使 TCP 堆栈向远程端发送特殊的探测帧。
    如果这样的探测失败,内核将关闭套接字,这将在您的代码中显示为“套接字准备就绪”事件,最近尝试读取和/或写入它失败并出现错误。

  • 请注意,TCP keepalive 是一种复杂的野兽,您可能需要研究它们是如何工作的,链路两端的内核是否需要调整,并在出现人工链路故障的情况下测试您的解决方案。
    你可能会开始你的旅程 here .

    关于go - 如何检测 TCPConn 是否存活,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61953995/

    27 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com