我的mesos版本最近从0.28升级到1.2.1.
正在使用Chronos安排工作.我的docker作业正在被正确调用,但仍然获得TASK_FAILED错误事件,它以退出状态ZERO完成.
这是可重现的.我试过多个mesos版本,但仍然没有运气.想知道我是否遗漏了什么.
OS详细信息: -
Kernel - 3.8.13-98.7.1.el7uek
OS - OL 7.3
Sanpshot - 7-2017.6.4
Run Code Online (Sandbox Code Playgroud)
因为,它不是最新的Kernal,我在Chronos Job环境变量中添加了以下内容,因为我无法安装最新的docker版本.
{
"name":"DOCKER_API_VERSION",
"value":"1.22"
}
Run Code Online (Sandbox Code Playgroud)
使用标志启动'mesos-docker-executor'
'--container="mesos-81cb9c2a-d18b-4127-872b-2a5676dfb314-S0.97dc2c67-5d69-4a8c-b4e1-ba15807697cf"
--docker="docker"
--docker_socket="/var/run/docker.sock"
--help="false"
--initialize_driver_logging="true"
--launcher_dir="/usr/libexec/mesos" --logbufsecs="0"
--logging_level="INFO"
--mapped_directory="/mnt/mesos/sandbox"
--quiet="false"
--sandbox_directory="/mesos-data/slave-1/slaves/81cb9c2a-d18b-4127-872b-2a5676dfb314-S0/docker/links/97dc2c67-5d69-4a8c-b4e1-ba15807697cf"
--stop_timeout="0ns"'
Run Code Online (Sandbox Code Playgroud)
Mesos奴隶日志: -
I0906 14:05:00.958442 9 slave.cpp:1625] Got assigned task 'ct:1504706700007:0:Job_Task_Test:' for framework 5175f6c9-0617-4145-ab46-3b7e64dc67ea-0000
I0906 14:05:00.958544 9 slave.cpp:6386] Checkpointing FrameworkInfo to '/mesos-data/slave-1/meta/slaves/81cb9c2a-d18b-4127-872b-2a5676dfb314-S0/frameworks/5175f6c9-0617-4145-ab46-3b7e64dc67ea-0000/framework.info'
I0906 14:05:00.958868 9 slave.cpp:6397] Checkpointing framework pid 'scheduler-766fa517-8ca6-430e-b044-7fa7e9b339b8@20.426.45.305:43144' to '/mesos-data/slave-1/meta/slaves/81cb9c2a-d18b-4127-872b-2a5676dfb314-S0/frameworks/5175f6c9-0617-4145-ab46-3b7e64dc67ea-0000/framework.pid'
I0906 14:05:00.959430 9 slave.cpp:1785] Launching task 'ct:1504706700007:0:Job_Task_Test:' for framework 5175f6c9-0617-4145-ab46-3b7e64dc67ea-0000
I0906 14:05:00.966035 9 paths.cpp:547] Trying …Run Code Online (Sandbox Code Playgroud) 我只是想从1.0.3将mesos版本升级到1.3.1.
Chronos调度程序能够通过mesos安排JOB.工作运行正常,能够看到mesos stdout日志.但是,仍然在mesos stderr日志中看到以下内容.docker作业运行正常,但状态仍显示为以下日志失败.
I0905 22:05:00.824811 456 exec.cpp:162] Version: 1.3.1
I0905 22:05:00.829165 459 exec.cpp:237] Executor registered on agent c63c93dc-3d9f-4322-9f82-0553fd1324fe-S0
E0905 22:05:11.773236 465 process.cpp:956] Failed to accept socket: future discarded
Run Code Online (Sandbox Code Playgroud) 这是每日/每周安排Spark Jobs的推荐工具.1)Oozie 2)Luigi 3)Azkaban 4)Chronos 5)气流
提前致谢.