- r - 以节省内存的方式增长 data.frame
- ruby-on-rails - ruby/ruby on rails 内存泄漏检测
- android - 无法解析导入android.support.v7.app
- UNIX 域套接字与共享内存(映射文件)
我正在尝试将 Mesos 从服务器连接到它的主服务器。每当从服务器尝试连接到主服务器时,我都会收到以下消息:
I0806 16:39:59.090845 935 hierarchical.hpp:528] Added slave 20150806-163941-1027506442-5050-921-S3 (debian) with cpus(*):1; mem(*):1938; disk(*):3777; ports(*):[31000-32000] (allocated: )
E0806 16:39:59.091384 940 socket.hpp:107] Shutdown failed on fd=25: Transport endpoint is not connected [107]
I0806 16:39:59.091508 940 master.cpp:3395] Registered slave 20150806-163941-1027506442-5050-921-S3 at slave(1)@127.0.1.1:5051 (debian) with cpus(*):1; mem(*):1938; disk(*):3777; ports(*):[31000-32000]
I0806 16:39:59.091747 940 master.cpp:1006] Slave 20150806-163941-1027506442-5050-921-S3 at slave(1)@127.0.1.1:5051 (debian) disconnected
I0806 16:39:59.091868 940 master.cpp:2203] Disconnecting slave 20150806-163941-1027506442-5050-921-S3 at slave(1)@127.0.1.1:5051 (debian)
I0806 16:39:59.092031 940 master.cpp:2222] Deactivating slave 20150806-163941-1027506442-5050-921-S3 at slave(1)@127.0.1.1:5051 (debian)
I0806 16:39:59.092248 939 hierarchical.hpp:621] Slave 20150806-163941-1027506442-5050-921-S3 deactivated
错误似乎是:
E0806 16:39:59.091384 940 socket.hpp:107] fd=25 时关闭失败:传输端点未连接 [107]
主机开始使用:
./mesos-master.sh --ip=10.129.62.61 --work_dir=~/Mesos/mesos-0.23.0/workdir/ --zk=zk://10.129.62.61:2181/mesos --quorum=1
还有奴隶
./mesos-slave.sh --master=zk://10.129.62.61:2181/mesos
如果我在与主机相同的虚拟机上运行从机,它工作正常。
我在互联网上找不到太多信息。我在 VirtualBox 5 上运行两个虚拟盒子 (Debian 8.1)。主机是 Windows 7。
编辑 1:
master 和 slave 都运行在一个专用的 VM 上。
两个虚拟机 nextorks 都使用桥接网络配置。
来自主人的ifconfig:
eth0 Link encap:Ethernet HWaddr 08:00:27:cc:6c:6e
inet addr:10.129.62.61 Bcast:10.129.255.255 Mask:255.255.0.0
inet6 addr: fe80::a00:27ff:fecc:6c6e/64 Scope:Link
UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1
RX packets:5335953 errors:0 dropped:0 overruns:0 frame:0
TX packets:1422428 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:1000
RX bytes:595886271 (568.2 MiB) TX bytes:362423868 (345.6 MiB)
来自从机的 ifconfig:
eth0 Link encap:Ethernet HWaddr 08:00:27:56:83:20
inet addr:10.129.62.49 Bcast:10.129.255.255 Mask:255.255.0.0
inet6 addr: fe80::a00:27ff:fe56:8320/64 Scope:Link
UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1
RX packets:4358561 errors:0 dropped:0 overruns:0 frame:0
TX packets:3825 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:1000
RX bytes:397126834 (378.7 MiB) TX bytes:354116 (345.8 KiB)
编辑 2:
slave 日志可以在 http://pastebin.com/CXZUBHKr 找到
可以在 http://pastebin.com/thYR1par 找到主日志
最佳答案
我遇到了类似的问题。我的奴隶日志将充满
E0812 15:58:04.017990 2193 socket.hpp:107] Shutdown failed on fd=13: Transport endpoint is not connected [107]
我的主人会的
F0120 20:45:48.025610 12116 master.cpp:1083] Recovery failed: Failed to recover registrar: Failed to perform fetch within 1mins
而且 master 会死亡,并且会发生新的选举,被杀死的 master 将由 upstart(我在 Centos 6 机器上)重新启动,并被添加到潜在的 masters 池中。因此,我选出的主节点将以菊花链形式围绕我的主节点。多次重启 masters 和 slaves 什么也没做,问题总是会在 master 选举后的 1 分钟内返回。
我的解决方案来自这个 stackoverflow 问题(谢谢)和 github 中的提示 gist note .
它的要点是/etc/default/mesos-master
必须指定一个quorum number(对于mesos master的数量它需要是正确的,在我的例子中是3)
MESOS_QUORUM=2
这对我来说很奇怪,因为我在文件 /etc/mesos-master/quorum
中有相同的信息
但是我把它添加到/etc/default/mesos-master
重启了mesos-masters和slaves,问题还没有回来。
希望对你有帮助
关于linux - 传输端点未连接 - Mesos 从站/主站,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31858937/
前不久,哔哩哔哩(一般常称为 B 站)发布了一篇文章《2021.07.13 我们是这样崩的》,详细回顾了他们在 2021.07.13 晚上全站崩溃约 3 小时的至暗时刻,以及万分紧张的故障定位与恢复过
想象一下这种情况,周围有一些智能手机和计算机,它们的 WiFi 适配器(无线适配器)打开,但没有必要连接到网络。 有没有办法通过 Linux 机器查看 MAC 地址? 任何见解表示赞赏。 最佳答案 断
我无法创建新的 Window Station 来运行我的应用程序 int _tmain(int argc, TCHAR* argv[], TCHAR* envp[]) { wprintf(L"
在 Conda 环境中安装包后,我想对该包中的代码进行一些更改。 在哪里可以找到包含已安装包的 site-packages 目录? 我有 Anaconda Python 2.7 base 发行版,但找
今天去改了matplotlib的配置。搜索 matplotlibrc 发现我有两个: 查看site-packages 文件夹,我发现很多包的名称中都有波浪号: ~klearn 是 sklearn ,但
我是一名优秀的程序员,十分优秀!