标签: mesos-chronos

Mesos 1.2.1和1.3.1 slave - docker job正常退出但报告为失败

我的mesos版本最近从0.28升级到1.2.1.

正在使用Chronos安排工作.我的docker作业正在被正确调用,但仍然获得TASK_FAILED错误事件,它以退出状态ZERO完成.

这是可重现的.我试过多个mesos版本,但仍然没有运气.想知道我是否遗漏了什么.

OS详细信息: -

Kernel  - 3.8.13-98.7.1.el7uek
OS - OL 7.3
Sanpshot - 7-2017.6.4
Run Code Online (Sandbox Code Playgroud)

因为,它不是最新的Kernal,我在Chronos Job环境变量中添加了以下内容,因为我无法安装最新的docker版本.

{
          "name":"DOCKER_API_VERSION",
          "value":"1.22"
      }
Run Code Online (Sandbox Code Playgroud)

使用标志启动'mesos-docker-executor'

'--container="mesos-81cb9c2a-d18b-4127-872b-2a5676dfb314-S0.97dc2c67-5d69-4a8c-b4e1-ba15807697cf" 
--docker="docker" 
--docker_socket="/var/run/docker.sock" 
--help="false" 
--initialize_driver_logging="true" 
--launcher_dir="/usr/libexec/mesos" --logbufsecs="0" 
--logging_level="INFO" 
--mapped_directory="/mnt/mesos/sandbox" 
--quiet="false" 
--sandbox_directory="/mesos-data/slave-1/slaves/81cb9c2a-d18b-4127-872b-2a5676dfb314-S0/docker/links/97dc2c67-5d69-4a8c-b4e1-ba15807697cf" 
--stop_timeout="0ns"'
Run Code Online (Sandbox Code Playgroud)

Mesos奴隶日志: -

    I0906 14:05:00.958442     9 slave.cpp:1625] Got assigned task 'ct:1504706700007:0:Job_Task_Test:' for framework 5175f6c9-0617-4145-ab46-3b7e64dc67ea-0000
I0906 14:05:00.958544     9 slave.cpp:6386] Checkpointing FrameworkInfo to '/mesos-data/slave-1/meta/slaves/81cb9c2a-d18b-4127-872b-2a5676dfb314-S0/frameworks/5175f6c9-0617-4145-ab46-3b7e64dc67ea-0000/framework.info'
I0906 14:05:00.958868     9 slave.cpp:6397] Checkpointing framework pid 'scheduler-766fa517-8ca6-430e-b044-7fa7e9b339b8@20.426.45.305:43144' to '/mesos-data/slave-1/meta/slaves/81cb9c2a-d18b-4127-872b-2a5676dfb314-S0/frameworks/5175f6c9-0617-4145-ab46-3b7e64dc67ea-0000/framework.pid'
I0906 14:05:00.959430     9 slave.cpp:1785] Launching task 'ct:1504706700007:0:Job_Task_Test:' for framework 5175f6c9-0617-4145-ab46-3b7e64dc67ea-0000
I0906 14:05:00.966035     9 paths.cpp:547] Trying …
Run Code Online (Sandbox Code Playgroud)

docker mesos mesosphere mesos-chronos

5
推荐指数
0
解决办法
466
查看次数

Mesos任务 - 无法接受套接字:将来被丢弃

我只是想从1.0.3将mesos版本升级到1.3.1.

Chronos调度程序能够通过mesos安排JOB.工作运行正常,能够看到mesos stdout日志.但是,仍然在mesos stderr日志中看到以下内容.docker作业运行正常,但状态仍显示为以下日志失败.

I0905 22:05:00.824811   456 exec.cpp:162] Version: 1.3.1
I0905 22:05:00.829165   459 exec.cpp:237] Executor registered on agent c63c93dc-3d9f-4322-9f82-0553fd1324fe-S0
E0905 22:05:11.773236   465 process.cpp:956] Failed to accept socket: future discarded
Run Code Online (Sandbox Code Playgroud)

docker mesos mesos-chronos

2
推荐指数
1
解决办法
3364
查看次数

及时安排火花工作

这是每日/每周安排Spark Jobs的推荐工具.1)Oozie 2)Luigi 3)Azkaban 4)Chronos 5)气流

提前致谢.

oozie azkaban luigi airflow mesos-chronos

1
推荐指数
1
解决办法
785
查看次数

标签 统计

mesos-chronos ×3

docker ×2

mesos ×2

airflow ×1

azkaban ×1

luigi ×1

mesosphere ×1

oozie ×1