传输端点未连接 - Mesos Slave/Master

ben*_*n.d 19 linux debian virtualbox marathon mesos

我正在尝试将Mesos奴隶连接到它的主人.当从属设备尝试连接到主设备时,我收到以下消息:

I0806 16:39:59.090845   935 hierarchical.hpp:528] Added slave 20150806-163941-1027506442-5050-921-S3 (debian) with cpus(*):1; mem(*):1938; disk(*):3777; ports(*):[31000-32000] (allocated: )
E0806 16:39:59.091384   940 socket.hpp:107] Shutdown failed on fd=25: Transport endpoint is not connected [107]
I0806 16:39:59.091508   940 master.cpp:3395] Registered slave 20150806-163941-1027506442-5050-921-S3 at slave(1)@127.0.1.1:5051 (debian) with cpus(*):1; mem(*):1938; disk(*):3777; ports(*):[31000-32000]
I0806 16:39:59.091747   940 master.cpp:1006] Slave 20150806-163941-1027506442-5050-921-S3 at slave(1)@127.0.1.1:5051 (debian) disconnected
I0806 16:39:59.091868   940 master.cpp:2203] Disconnecting slave 20150806-163941-1027506442-5050-921-S3 at slave(1)@127.0.1.1:5051 (debian)
I0806 16:39:59.092031   940 master.cpp:2222] Deactivating slave 20150806-163941-1027506442-5050-921-S3 at slave(1)@127.0.1.1:5051 (debian)
I0806 16:39:59.092248   939 hierarchical.hpp:621] Slave 20150806-163941-1027506442-5050-921-S3 deactivated
Run Code Online (Sandbox Code Playgroud)

错误似乎是:

E0806 16:39:59.091384 940 socket.hpp:107] fd = 25时关闭失败:传输端点未连接[107]

主持人开始使用:

./mesos-master.sh --ip=10.129.62.61 --work_dir=~/Mesos/mesos-0.23.0/workdir/ --zk=zk://10.129.62.61:2181/mesos --quorum=1
Run Code Online (Sandbox Code Playgroud)

和奴隶

./mesos-slave.sh --master=zk://10.129.62.61:2181/mesos
Run Code Online (Sandbox Code Playgroud)

如果我在与主机相同的VM上运行从机,它工作正常.

我在互联网上找不到太多信息.我在VirtualBox 5上运行了两个虚拟盒(Debian 8.1).主机是一个Windows 7.

编辑1:

主服务器和从服务器都在专用VM上运行.

两个虚拟机都使用桥接网络进行配置.

来自master的ifconfig:

eth0      Link encap:Ethernet  HWaddr 08:00:27:cc:6c:6e
          inet addr:10.129.62.61  Bcast:10.129.255.255  Mask:255.255.0.0
          inet6 addr: fe80::a00:27ff:fecc:6c6e/64 Scope:Link
          UP BROADCAST RUNNING MULTICAST  MTU:1500  Metric:1
          RX packets:5335953 errors:0 dropped:0 overruns:0 frame:0
          TX packets:1422428 errors:0 dropped:0 overruns:0 carrier:0
          collisions:0 txqueuelen:1000
          RX bytes:595886271 (568.2 MiB)  TX bytes:362423868 (345.6 MiB)
Run Code Online (Sandbox Code Playgroud)

来自slave的ifconfig:

eth0      Link encap:Ethernet  HWaddr 08:00:27:56:83:20
          inet addr:10.129.62.49  Bcast:10.129.255.255  Mask:255.255.0.0
          inet6 addr: fe80::a00:27ff:fe56:8320/64 Scope:Link
          UP BROADCAST RUNNING MULTICAST  MTU:1500  Metric:1
          RX packets:4358561 errors:0 dropped:0 overruns:0 frame:0
          TX packets:3825 errors:0 dropped:0 overruns:0 carrier:0
          collisions:0 txqueuelen:1000
          RX bytes:397126834 (378.7 MiB)  TX bytes:354116 (345.8 KiB)
Run Code Online (Sandbox Code Playgroud)

编辑2:

可以在http://pastebin.com/CXZUBHKr上找到从属日志

主日志可以在http://pastebin.com/thYR1par找到

小智 12

我遇到了类似的问题.我的奴隶日志将被填满

    E0812 15:58:04.017990  2193 socket.hpp:107] Shutdown failed on fd=13: Transport endpoint is not connected [107]
Run Code Online (Sandbox Code Playgroud)

我的主人会有

    F0120 20:45:48.025610 12116 master.cpp:1083] Recovery failed: Failed to recover registrar: Failed to perform fetch within 1mins
Run Code Online (Sandbox Code Playgroud)

而且主人会死,新的选举将会发生,被杀害的主人将被新贵重启(我在Centos 6盒子上),并被添加到潜在的主人的池中.因此,我当选的主人将围绕我的主节点菊花链.很多主人和奴隶的重新启动没有任何问题,在大师选举的1分钟内问题就会一直恢复.

我的解决方案来自这个stackoverflow问题(谢谢)和一个github gist笔记中的提示.

它的要点是/etc/default/mesos-master必须指定一个仲裁号码(它必须对于mesos主人的数量是正确的,在我的情况下是3)

    MESOS_QUORUM=2
Run Code Online (Sandbox Code Playgroud)

这对我来说很奇怪,因为我在文件中有相同的信息 /etc/mesos-master/quorum

但我添加它/etc/default/mesos-master重新启动了mesos-master和slave并且问题没有返回.

我希望这可以帮助你.