linux - 传输端点未连接 - Mesos 从站/主站-6ren

linux - 传输端点未连接 - Mesos 从站/主站

转载作者：IT王子更新时间：2023-10-29 00:19:49

25

4

我正在尝试将 Mesos 从服务器连接到它的主服务器。每当从服务器尝试连接到主服务器时，我都会收到以下消息:

I0806 16:39:59.090845   935 hierarchical.hpp:528] Added slave 20150806-163941-1027506442-5050-921-S3 (debian) with cpus(*):1; mem(*):1938; disk(*):3777; ports(*):[31000-32000] (allocated: )
E0806 16:39:59.091384   940 socket.hpp:107] Shutdown failed on fd=25: Transport endpoint is not connected [107]
I0806 16:39:59.091508   940 master.cpp:3395] Registered slave 20150806-163941-1027506442-5050-921-S3 at slave(1)@127.0.1.1:5051 (debian) with cpus(*):1; mem(*):1938; disk(*):3777; ports(*):[31000-32000]
I0806 16:39:59.091747   940 master.cpp:1006] Slave 20150806-163941-1027506442-5050-921-S3 at slave(1)@127.0.1.1:5051 (debian) disconnected
I0806 16:39:59.091868   940 master.cpp:2203] Disconnecting slave 20150806-163941-1027506442-5050-921-S3 at slave(1)@127.0.1.1:5051 (debian)
I0806 16:39:59.092031   940 master.cpp:2222] Deactivating slave 20150806-163941-1027506442-5050-921-S3 at slave(1)@127.0.1.1:5051 (debian)
I0806 16:39:59.092248   939 hierarchical.hpp:621] Slave 20150806-163941-1027506442-5050-921-S3 deactivated

错误似乎是:

E0806 16:39:59.091384 940 socket.hpp:107] fd=25 时关闭失败:传输端点未连接 [107]

主机开始使用:

./mesos-master.sh --ip=10.129.62.61 --work_dir=~/Mesos/mesos-0.23.0/workdir/ --zk=zk://10.129.62.61:2181/mesos --quorum=1

还有奴隶

./mesos-slave.sh --master=zk://10.129.62.61:2181/mesos

如果我在与主机相同的虚拟机上运行从机，它工作正常。

我在互联网上找不到太多信息。我在 VirtualBox 5 上运行两个虚拟盒子 (Debian 8.1)。主机是 Windows 7。

编辑 1:

master 和 slave 都运行在一个专用的 VM 上。

两个虚拟机 nextorks 都使用桥接网络配置。

来自主人的ifconfig:

eth0      Link encap:Ethernet  HWaddr 08:00:27:cc:6c:6e
          inet addr:10.129.62.61  Bcast:10.129.255.255  Mask:255.255.0.0
          inet6 addr: fe80::a00:27ff:fecc:6c6e/64 Scope:Link
          UP BROADCAST RUNNING MULTICAST  MTU:1500  Metric:1
          RX packets:5335953 errors:0 dropped:0 overruns:0 frame:0
          TX packets:1422428 errors:0 dropped:0 overruns:0 carrier:0
          collisions:0 txqueuelen:1000
          RX bytes:595886271 (568.2 MiB)  TX bytes:362423868 (345.6 MiB)

来自从机的 ifconfig:

eth0      Link encap:Ethernet  HWaddr 08:00:27:56:83:20
          inet addr:10.129.62.49  Bcast:10.129.255.255  Mask:255.255.0.0
          inet6 addr: fe80::a00:27ff:fe56:8320/64 Scope:Link
          UP BROADCAST RUNNING MULTICAST  MTU:1500  Metric:1
          RX packets:4358561 errors:0 dropped:0 overruns:0 frame:0
          TX packets:3825 errors:0 dropped:0 overruns:0 carrier:0
          collisions:0 txqueuelen:1000
          RX bytes:397126834 (378.7 MiB)  TX bytes:354116 (345.8 KiB)

编辑 2:

slave 日志可以在 http://pastebin.com/CXZUBHKr 找到

可以在 http://pastebin.com/thYR1par 找到主日志

最佳答案

我遇到了类似的问题。我的奴隶日志将充满

    E0812 15:58:04.017990  2193 socket.hpp:107] Shutdown failed on fd=13: Transport endpoint is not connected [107]

我的主人会的

    F0120 20:45:48.025610 12116 master.cpp:1083] Recovery failed: Failed to recover registrar: Failed to perform fetch within 1mins

而且 master 会死亡，并且会发生新的选举，被杀死的 master 将由 upstart(我在 Centos 6 机器上)重新启动，并被添加到潜在的 masters 池中。因此，我选出的主节点将以菊花链形式围绕我的主节点。多次重启 masters 和 slaves 什么也没做，问题总是会在 master 选举后的 1 分钟内返回。

我的解决方案来自这个 stackoverflow 问题(谢谢)和 github 中的提示 gist note .

它的要点是/etc/default/mesos-master必须指定一个quorum number(对于mesos master的数量它需要是正确的，在我的例子中是3)

    MESOS_QUORUM=2

这对我来说很奇怪，因为我在文件 /etc/mesos-master/quorum 中有相同的信息

但是我把它添加到/etc/default/mesos-master 重启了mesos-masters和slaves，问题还没有回来。

希望对你有帮助

关于linux - 传输端点未连接 - Mesos 从站/主站，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/31858937/

25

4

0

文章推荐： mysql - 相当于 MySQL group_concat 的 Presto

文章推荐： php - 获取数组中除最后一个之外的所有值

文章推荐： mysql - 无法在 Zend Framework 中回滚事务

文章推荐： php - 从数组中删除非整数项

7 行代码搞崩溃 B 站，原因令人唏嘘！
前不久，哔哩哔哩（一般常称为 B 站）发布了一篇文章《2021.07.13 我们是这样崩的》，详细回顾了他们在 2021.07.13 晚上全站崩溃约 3 小时的至暗时刻，以及万分紧张的故障定位与恢复过
wifi - 查找周围支持 wifi 的设备 [站]
想象一下这种情况，周围有一些智能手机和计算机，它们的 WiFi 适配器(无线适配器)打开，但没有必要连接到网络。有没有办法通过 Linux 机器查看 MAC 地址？任何见解表示赞赏。最佳答案断
c++ - 应用程序无法使用 CreateWindowStation 创建 Windows 站
我无法创建新的 Window Station 来运行我的应用程序 int _tmain(int argc, TCHAR* argv[], TCHAR* envp[]) { wprintf(L"
python - 站 pip 包位于 Conda 环境中的什么位置？
在 Conda 环境中安装包后，我想对该包中的代码进行一些更改。在哪里可以找到包含已安装包的 site-packages 目录？我有 Anaconda Python 2.7 base 发行版，但找
python - 名称中带有波浪号的 Anaconda/Python 站 pip 包子文件夹 - 它们是什么？
今天去改了matplotlib的配置。搜索 matplotlibrc 发现我有两个: 查看site-packages 文件夹，我发现很多包的名称中都有波浪号: ~klearn 是 sklearn ，但

首页

博学

6Ren·AI

商城

linux - 传输端点未连接 - Mesos 从站/主站