gpt4 book ai didi

java - StompBrokerRelayMessageHandler - 传输失败 : java. lang.IllegalStateException:没有可用的 TcpConnection

转载 作者:行者123 更新时间:2023-12-01 16:44:09 27 4
gpt4 key购买 nike

我们在我们的项目中使用 STOMP 代理中继(外部代理 - ActiveMQ 5.13.2)请参阅 https://docs.spring.io/spring/docs/current/spring-framework-reference/web.html#websocket-stomp-handle-broker-relay

我们使用以下堆栈:

org.springframework:spring-jms:jar:5.1.8.RELEASE
org.springframework:spring-messaging:jar:5.1.8.RELEASE
io.projectreactor:reactor-core:jar:3.2.8.RELEASE
io.projectreactor.netty:reactor-netty:jar:0.8.6.RELEASE
io.netty:netty-all:jar:4.1.34.Final

有时(假设每两周一次)我们可以在 tomcat catalina.out 日志中观察到错误

2019-08-21 13:38:58,891 [tcp-client-scheduler-5] ERROR com.*.websocket.stomp.SimpMessagingSender  - BrokerAvailabilityEvent[available=false, StompBrokerRelay[ReactorNettyTcpClient[reactor.netty.tcp.TcpClientDoOn@219abb46]]]
2019-08-21 13:38:58,965 [tcp-client-scheduler-1] ERROR org.springframework.messaging.simp.stomp.StompBrokerRelayMessageHandler - Transport failure: java.lang.IllegalStateException: No TcpConnection available

出现错误后,STOMP 通信中断(系统 连接 - 单个 TCP 连接不可用)

似乎一切都是从我们更新堆栈时开始的:

org.springframework:spring-jms:jar:5.0.8.RELEASE
org.springframework:spring-messaging:jar:5.0.8.RELEASE
io.projectreactor:reactor-core:jar:3.1.8.RELEASE
io.projectreactor.netty:reactor-netty:jar:0.7.8.RELEASE
io.netty:netty-all:jar:4.1.25.Final

ActiveMQ版本未更改

spring 报告了一个错误,当 system 连接丢失时,自动重新连接失败,请参阅: https://github.com/spring-projects/spring-framework/issues/22080

现在有 3 个问题:

  1. 如何使这个问题更具重现性?
  2. 如何修复此重新连接行为? :)
  3. 如何防止失去此连接? :)

编辑2019年9月23日

发生错误后,端口 61613(STOMP) 的 TCP 堆栈如下(请注意 CLOSE_WAIT 状态):

netstat -an | grep 61613
tcp6 0 0 :::61613 :::* LISTEN
tcp6 2 0 127.0.0.1:49084 127.0.0.1:61613 CLOSE_WAIT

最佳答案

尽管我有一些意见可以帮助您找到前进的方向,但我不能说我有足够的信息来回答您的问题。

ActiveMQ 通常在托管/分布式环境中使用,因此负载和扩展应始终成为考虑因素。

大多数数据库/消息队列/等..将需要某种负载调整 - 即使在 AWS 上(通过请求更高的限制),尽管其中大部分是由托管提供商处理的。

但是我离题了...

在本例中,您似乎正在为队列使用 TCP 传输:

https://activemq.apache.org/tcp-transport-reference

如您所见,所有这些设置都可以调整并具有默认值。

因此,如果从连接到 AMQ 的 Spring 端记录问题,您需要缩小错误发生的时间,然后查看 AMQ 指标和日志。

如果您没有 AMQ 监控,我建议:

  1. 添加监控 - https://activemq.apache.org/how-can-i-monitor-activemq
  2. 添加日志记录(或找出日志的位置)。 - 然后启用详细日志记录。 (AMQ 使用 log4j,因此只需查看 log4j 配置文件或添加一个即可。)除此之外,请考虑将日志发送到日志聚合器。 -- https://activemq.apache.org/how-can-i-enable-detailed-logging
  3. 查看您的托管提供商的指标和停机时间。例如,如果使用 AWS,则会有非常详细的事件日志,包括网络故障或 VPC 或跨区域隧道的瞬时问题、网络流量输入/输出等。

为您的分布式系统设置正确的工具以使您的团队能够搜索/查找错误/日志(并记录如何执行此操作)非常有帮助。超越此(对于成熟系统)的一步是在监控之上添加一个层,以便您的系统在出现问题时开始告诉您,而不是相反(寻找问题)。

这可能有点冗长 - 但这一切都会导致我询问您是否有 AMQ 系统发生故障时的日志/指标。如果您这样做,请发布它们!

我提出这些建议是因为:

  • 没有提供有关您的负载预期、负载变化的信息,也没有提供有关负载是系统中考虑因素的认识(通过故障排除步骤)的信息。
  • 提供的日志/错误完全来自客户端。
  • 错误的重现性很少且不一致 - 因此它几乎可能是任何问题(内存泄漏、加载问题等) - 因此监控是必要的。

还可以考虑添加 Spring Actuator 来在 Spring 端监视消息客户端,因为客户端连接池和高级设置也经常存在限制/设置,特别是当您放大/缩小实例大小等时......以及您的实例将处理更多/更少的负载,您的客户端库可能需要一些设置调整。

https://www.baeldung.com/spring-boot-actuators

Exposing metrics about current Websocket connections with Spring

您还可以捕获异常并拆除并重新创建连接/设置 - 尽管这不是我在不了解连接失败时的情况和统计​​信息的情况下推荐的第一件事。

关于java - StompBrokerRelayMessageHandler - 传输失败 : java. lang.IllegalStateException:没有可用的 TcpConnection,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57992857/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com