gpt4 book ai didi

linux - 传输端点未连接 - Mesos 从站/主站

转载 作者:IT王子 更新时间:2023-10-29 00:19:49 25 4
gpt4 key购买 nike

我正在尝试将 Mesos 从服务器连接到它的主服务器。每当从服务器尝试连接到主服务器时,我都会收到以下消息:

I0806 16:39:59.090845   935 hierarchical.hpp:528] Added slave 20150806-163941-1027506442-5050-921-S3 (debian) with cpus(*):1; mem(*):1938; disk(*):3777; ports(*):[31000-32000] (allocated: )
E0806 16:39:59.091384 940 socket.hpp:107] Shutdown failed on fd=25: Transport endpoint is not connected [107]
I0806 16:39:59.091508 940 master.cpp:3395] Registered slave 20150806-163941-1027506442-5050-921-S3 at slave(1)@127.0.1.1:5051 (debian) with cpus(*):1; mem(*):1938; disk(*):3777; ports(*):[31000-32000]
I0806 16:39:59.091747 940 master.cpp:1006] Slave 20150806-163941-1027506442-5050-921-S3 at slave(1)@127.0.1.1:5051 (debian) disconnected
I0806 16:39:59.091868 940 master.cpp:2203] Disconnecting slave 20150806-163941-1027506442-5050-921-S3 at slave(1)@127.0.1.1:5051 (debian)
I0806 16:39:59.092031 940 master.cpp:2222] Deactivating slave 20150806-163941-1027506442-5050-921-S3 at slave(1)@127.0.1.1:5051 (debian)
I0806 16:39:59.092248 939 hierarchical.hpp:621] Slave 20150806-163941-1027506442-5050-921-S3 deactivated

错误似乎是:

E0806 16:39:59.091384 940 socket.hpp:107] fd=25 时关闭失败:传输端点未连接 [107]

主机开始使用:

./mesos-master.sh --ip=10.129.62.61 --work_dir=~/Mesos/mesos-0.23.0/workdir/ --zk=zk://10.129.62.61:2181/mesos --quorum=1

还有奴隶

./mesos-slave.sh --master=zk://10.129.62.61:2181/mesos

如果我在与主机相同的虚拟机上运行从机,它工作正常。

我在互联网上找不到太多信息。我在 VirtualBox 5 上运行两个虚拟盒子 (Debian 8.1)。主机是 Windows 7。

编辑 1:

master 和 slave 都运行在一个专用的 VM 上。

两个虚拟机 nextorks 都使用桥接网络配置。

来自主人的ifconfig:

eth0      Link encap:Ethernet  HWaddr 08:00:27:cc:6c:6e
inet addr:10.129.62.61 Bcast:10.129.255.255 Mask:255.255.0.0
inet6 addr: fe80::a00:27ff:fecc:6c6e/64 Scope:Link
UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1
RX packets:5335953 errors:0 dropped:0 overruns:0 frame:0
TX packets:1422428 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:1000
RX bytes:595886271 (568.2 MiB) TX bytes:362423868 (345.6 MiB)

来自从机的 ifconfig:

eth0      Link encap:Ethernet  HWaddr 08:00:27:56:83:20
inet addr:10.129.62.49 Bcast:10.129.255.255 Mask:255.255.0.0
inet6 addr: fe80::a00:27ff:fe56:8320/64 Scope:Link
UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1
RX packets:4358561 errors:0 dropped:0 overruns:0 frame:0
TX packets:3825 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:1000
RX bytes:397126834 (378.7 MiB) TX bytes:354116 (345.8 KiB)

编辑 2:

slave 日志可以在 http://pastebin.com/CXZUBHKr 找到

可以在 http://pastebin.com/thYR1par 找到主日志

最佳答案

我遇到了类似的问题。我的奴隶日志将充满

    E0812 15:58:04.017990  2193 socket.hpp:107] Shutdown failed on fd=13: Transport endpoint is not connected [107]

我的主人会的

    F0120 20:45:48.025610 12116 master.cpp:1083] Recovery failed: Failed to recover registrar: Failed to perform fetch within 1mins

而且 master 会死亡,并且会发生新的选举,被杀死的 master 将由 upstart(我在 Centos 6 机器上)重新启动,并被添加到潜在的 masters 池中。因此,我选出的主节点将以菊花链形式围绕我的主节点。多次重启 masters 和 slaves 什么也没做,问题总是会在 master 选举后的 1 分钟内返回。

我的解决方案来自这个 stackoverflow 问题(谢谢)和 github 中的提示 gist note .

它的要点是/etc/default/mesos-master必须指定一个quorum number(对于mesos master的数量它需要是正确的,在我的例子中是3)

    MESOS_QUORUM=2

这对我来说很奇怪,因为我在文件 /etc/mesos-master/quorum 中有相同的信息

但是我把它添加到/etc/default/mesos-master 重启了mesos-masters和slaves,问题还没有回来。

希望对你有帮助

关于linux - 传输端点未连接 - Mesos 从站/主站,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31858937/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com