gpt4 book ai didi

docker - Aerospike Hearbeat 调用卡在 TIME_WAIT

转载 作者:行者123 更新时间:2023-12-01 23:07:11 31 4
gpt4 key购买 nike

我正在尝试在 GCP 上设置 Aerospike 集群。我正在使用 Core OS 和 Docker 来运行 Aerospike 守护进程。

我在 aerospike.conf 中为 as-node-01 配置了以下内容

    service {
service-threads 10

}

network {

service {
address any
port 3000
access-address as-node-01
}
fabric {
address any
port 3001

}
info {
address any
port 3003
}
heartbeat {
mode mesh
address as-node-01
port 3002
mesh-seed-address-port as-node-02 3002
mesh-seed-address-port as-node-01 3002

}
}


logging {
console {
context any info
}
}


namespace rte {
memory-size 4G
replication-factor 1
high-water-memory-pct 60

stop-writes-pct 90
default-ttl 0

storage-engine memory
}

和以下 as-node-02

    service {
service-threads 10

}

network {

service {
address any
port 3000
access-address as-node-02
}
fabric {
address any
port 3001

}
info {
address any
port 3003
}
heartbeat {
mode mesh
address as-node-01
port 3002
mesh-seed-address-port as-node-01 3002
mesh-seed-address-port as-node-02 3002

}
}


logging {
console {
context any info
}
}


namespace rte {
memory-size 4G
replication-factor 1
high-water-memory-pct 60

stop-writes-pct 90
default-ttl 0

storage-engine memory
}

我正在使用 aerospike:4.6.0.4 docker 图像和以下命令

docker run -d -v `pwd`:/opt/aerospike/etc --name aerospike -p 3000:3000 -p 3001:3001 -p 3002:3002 -p 3003:3003 aerospike asd --foreground --config-file /opt/aerospike/etc/aerospike.conf

当我在两个节点上启动守护程序时,我在日志内容中看到以下内容。

Nov 02 2019 07:20:23 GMT: WARNING (socket): (socket.c:959) (repeated:67) Error while connecting socket to 10.160.0.14:3002
Nov 02 2019 07:20:23 GMT: WARNING (hb): (hb.c:4882) (repeated:67) could not create heartbeat connection to node {10.160.0.14:3002}
Nov 02 2019 07:20:23 GMT: WARNING (socket): (socket.c:900) (repeated:67) Error while connecting: 111 (Connection refused)

然后我尝试使用 netstat 查看问题所在,我看到心跳调用卡在 TIME_WAIT 状态。

tcp6       0      0 as-node-01.asia-so:3002 172.17.0.2:39890        TIME_WAIT  
tcp6 0 0 as-node-01.asia-so:3002 172.17.0.2:38662 TIME_WAIT
tcp6 0 0 as-node-01.asia-so:3002 172.17.0.2:39998 TIME_WAIT
tcp6 0 0 as-node-01.asia-so:3002 172.17.0.2:39878 TIME_WAIT
tcp6 0 0 as-node-01.asia-so:3002 172.17.0.2:39716 TIME_WAIT
tcp6 0 0 as-node-01.asia-so:3002 172.17.0.2:39252 TIME_WAIT
tcp6 0 0 as-node-01.asia-so:3002 172.17.0.2:39872 TIME_WAIT
tcp6 0 0 as-node-01.asia-so:3002 172.17.0.2:39776 TIME_WAIT
tcp6 0 0 as-node-01.asia-so:3002 172.17.0.2:38796 TIME_WAIT
tcp6 0 0 as-node-01.asia-so:3002 172.17.0.2:38668 TIME_WAIT
tcp6 0 0 as-node-01.asia-so:3002 172.17.0.2:38844 TIME_WAIT
tcp6 0 0 as-node-01.asia-so:3002 172.17.0.2:39668 TIME_WAIT
tcp6 0 0 as-node-01.asia-so:3002 172.17.0.2:39120 TIME_WAIT
tcp6 0 0 as-node-01.asia-so:3002 172.17.0.2:39138 TIME_WAIT
tcp6 0 0 as-node-01.asia-so:3002 172.17.0.2:39174 TIME_WAIT
tcp6 0 0 as-node-01.asia-so:3002 172.17.0.2:38740 TIME_WAIT
tcp6 0 0 as-node-01.asia-so:3002 172.17.0.2:39614 TIME_WAIT
tcp6 0 0 as-node-01.asia-so:3002 172.17.0.2:39000 TIME_WAIT
tcp6 0 0 as-node-01.asia-so:3002 172.17.0.2:39318 TIME_WAIT
tcp6 0 0 as-node-01.asia-so:3002 172.17.0.2:38982 TIME_WAIT
tcp6 0 0 as-node-01.asia-so:3002 172.17.0.2:39584 TIME_WAIT
tcp6 0 0 as-node-01.asia-so:3002 172.17.0.2:39420 TIME_WAIT
tcp6 0 0 as-node-01.asia-so:3002 172.17.0.2:38758 TIME_WAIT
tcp6 0 0 as-node-01.asia-so:3002 172.17.0.2:39656 TIME_WAIT
tcp6 0 0 as-node-01.asia-so:3002 172.17.0.2:39866 TIME_WAIT
tcp6 0 0 as-node-01.asia-so:3002 172.17.0.2:39482 TIME_WAIT
tcp6 0 0 as-node-01.asia-so:3002 172.17.0.2:39222 TIME_WAIT
tcp6 0 0 as-node-01.asia-so:3002 172.17.0.2:39818 TIME_WAIT

TIME_WAIT 状态下有数百个这样的调用。

我无法弄清楚为什么这些调用会卡在 TIME_WAIT 中并且没有被转发到 docker 容器。

最佳答案

看起来您正在两个不同的节点上运行两个容器。并在 aerospike.conf 中使用节点(主机)名称。

heartbeat {
mode mesh
address as-node-01
port 3002
mesh-seed-address-port as-node-01 3002
mesh-seed-address-port as-node-02 3002
}
  • address as-node-01 指向一个接口(interface),如果容器不在主机网络上,则该接口(interface)将无法在容器内部访问。这就是为什么 --network=host 对您有用。
  • 如果您未使用 --net=host,则默认情况下容器位于专用网络上,无法 ping 通其他主机(节点)或连接到其他主机上的容器。

因此,要使用它,您可能需要一个覆盖网络(用于 多主机网络)。然后你可以简单地使用容器的 aerospike mesh 配置中的私有(private) IP。

你可以试试docker swarm。如果不是 docker swarm,您可能需要运行外部键值存储(如 consul 等)以通过覆盖网络进行发现。

https://www.aerospike.com/docs/deploy_guides/docker/networking/index.html

https://docs.docker.com/network/overlay-standalone.swarm/

https://docs.docker.com/network/overlay/

关于docker - Aerospike Hearbeat 调用卡在 TIME_WAIT,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58669123/

31 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com