我对Mesos很陌生,我仍然试图围绕它的概念和想法.到目前为止,我想我已经明白,基本上Mesos试图抽象出你的数据中心并将其作为一台大型计算机呈现.
使用Mesos + Docker集成,基本上可以在Mesos上运行任何应用程序,只要您的应用程序可以在Docker容器内运行即可.
这让我期望我可以使用Mesos来运行Node.js应用程序.这不应该太难设置.
我知道我需要创建一个新的应用程序,设置它的实例和co.,然后去实现它.然后,Mesos部署我的应用程序,并负责通过数据中心进行分发.在询问Mesos的端点时,我可以找到创建的IP地址/主机名和端口.
但是,当然,我希望Web应用程序可以在特定域或子域(最好是端口80或443)上使用,也可以使用负载平衡和高可用性.有什么内置Mesos,我可以使用是什么?
在Twitter的开源办公室负责人的第25 次演讲中,主持人说,Mesos允许人们跟踪和管理GPU(我认为他的意思是GPGPU)资源.但我无法在其他地方找到任何相关信息.有人可以帮忙吗?除了Mesos之外,还有其他支持GPGPU的集群管理器吗?
我看到Mesosphere在Mesos框架上构建了各种应用程序,如Hadoop,Kubernetes等,但由于Marathon应用程序用于长期运行的服务,为什么不直接使用它呢?例如,为什么不在一堆Marathon服务上设置Kubernetes节点?为什么直接在Framework API上实现Kubernetes?因为调度更有效率吗?同样的问题适用于Jenkins的实现,为什么不只是在Marathon上运行Jenkins主/从...
我有一些mesos-slave节点,我想暴露给互联网.因此,我希望mesos-slave提供端口80和443以及其默认的大量端口/资源.
根据我的收集,我需要调整--resources参数,并在端口资源产品中包含80和443.但是,从我的测试来看,在执行此操作时,我还必须对机器的CPU /内存/磁盘产品进行硬编码(而不是允许mesos-slave在运行时确定这些).
因为我想运行的节点的大小mesos-slave将来可能会改变,所以我想避免硬编码CPU/Mem/Disk产品并让它们在运行时确定.如何在--resource不对CPU /内存/磁盘产品进行硬编码的情况下更改mesos-slave的端口产品?理想情况下,这样的系统是附加的:" 除默认端口外还提供端口80/443 ".
最好!
Advait
我们在AWS上使用Mesosphere在私有VPC中建立了一个测试集群.我们有一些公共的Docker镜像,这些镜像很容易部署.但是,我们的大多数服务都是私有映像,托管在Docker Hub私有计划上,并且需要身份验证才能访问.
Mesosphere能够进行私有注册表身份验证,但它以不太完美的方式实现:需要在所有Mesos/Marathon任务定义中指定.dockercfg文件的HTTPS URI.
正如标题所暗示的那样,问题基本上是:.dockercfg文件应该如何在AWS中托管,以便访问可能仅限于Mesos master + slaves尽可能紧密?
amazon-web-services amazon-vpc mesos mesosphere docker-registry
有没有办法从法定人数中获得当前领先的Mesos-master的IP?任何变量都存储该值吗?
我是Mesos的新手,刚刚在我的测试服务器上设置了mesos和zookeeper.
不幸的是,我一直在我的mesos控制台上收到此错误消息,表明我无法连接到端口5050上的mesos,似乎无法找出原因.
我在下面的屏幕截图中包含了错误
mesos日志文件未指出错误显示的原因.
我在这里按照这些说明使用terraform在Digital Ocean(DC/OS 1.9)上创建了一个集群
一切似乎都已正确安装,从私有docker repo中提取,我需要向我添加一个压缩.docker文件,/core/home/并在部署期间通过将其包含在我的JSON中来获取它.
"fetch":[
{
"uri":"file:///home/core/docker.tar.gz"
}
]
Run Code Online (Sandbox Code Playgroud)
根据这些说明:https://docs.mesosphere.com/1.9/deploying-services/momee/docker-creds-agent/
我仍然会收到错误:
Failed to launch container:
Failed to fetch all URIs for container 'abc123-xxxxx' with exit status: 256
Run Code Online (Sandbox Code Playgroud)
查看其中一个代理的日志:
Starting container '123-abc-xxx' for task 'my-docker-image-service.321-dfg-xxx' (and executor 'my-docker-image-service.397d20cb-1
Begin fetcher log (stderr in sandbox) for container 123-abc-xxx from running command: /opt/mesosphere/packages/mesos--aaedd03eee0d57f5c0d49c
Fetcher Info: {"cache_directory":"\/tmp\/mesos\/fetch\/slaves\/94af100c-4dc2-416d-b6d7-eec0d947a1a6-S11","items":[{"action":"BYPASS_CACHE","uri":{"cache":false,"executable":false,"extract":true,"value":"file:\/\/\/home\/core\/docker.tar.gz"}}],"sandbox_directory":"\/var\/lib\/mesos\/slave\/slaves\/94af100c-4dc2-416d-b6d7-eec0d947a1a6-S11\/frameworks\/94af100c-4dc2-416...
Fetching URI 'file:///home/core/docker.tar.gz'
Fetching directly into the sandbox directory
Fetching URI 'file:///home/core/docker.tar.gz'
Copied resource '/home/core/docker.tar.gz' to '/var/lib/mesos/slave/slaves/94af100c-4dc2-416d-b6d7-eec0d947a1a6-S11/frameworks/94af100c-4dc2-416d-b6d7-eec0d947a1a6-0 …Run Code Online (Sandbox Code Playgroud) 我的mesos版本最近从0.28升级到1.2.1.
正在使用Chronos安排工作.我的docker作业正在被正确调用,但仍然获得TASK_FAILED错误事件,它以退出状态ZERO完成.
这是可重现的.我试过多个mesos版本,但仍然没有运气.想知道我是否遗漏了什么.
OS详细信息: -
Kernel - 3.8.13-98.7.1.el7uek
OS - OL 7.3
Sanpshot - 7-2017.6.4
Run Code Online (Sandbox Code Playgroud)
因为,它不是最新的Kernal,我在Chronos Job环境变量中添加了以下内容,因为我无法安装最新的docker版本.
{
"name":"DOCKER_API_VERSION",
"value":"1.22"
}
Run Code Online (Sandbox Code Playgroud)
使用标志启动'mesos-docker-executor'
'--container="mesos-81cb9c2a-d18b-4127-872b-2a5676dfb314-S0.97dc2c67-5d69-4a8c-b4e1-ba15807697cf"
--docker="docker"
--docker_socket="/var/run/docker.sock"
--help="false"
--initialize_driver_logging="true"
--launcher_dir="/usr/libexec/mesos" --logbufsecs="0"
--logging_level="INFO"
--mapped_directory="/mnt/mesos/sandbox"
--quiet="false"
--sandbox_directory="/mesos-data/slave-1/slaves/81cb9c2a-d18b-4127-872b-2a5676dfb314-S0/docker/links/97dc2c67-5d69-4a8c-b4e1-ba15807697cf"
--stop_timeout="0ns"'
Run Code Online (Sandbox Code Playgroud)
Mesos奴隶日志: -
I0906 14:05:00.958442 9 slave.cpp:1625] Got assigned task 'ct:1504706700007:0:Job_Task_Test:' for framework 5175f6c9-0617-4145-ab46-3b7e64dc67ea-0000
I0906 14:05:00.958544 9 slave.cpp:6386] Checkpointing FrameworkInfo to '/mesos-data/slave-1/meta/slaves/81cb9c2a-d18b-4127-872b-2a5676dfb314-S0/frameworks/5175f6c9-0617-4145-ab46-3b7e64dc67ea-0000/framework.info'
I0906 14:05:00.958868 9 slave.cpp:6397] Checkpointing framework pid 'scheduler-766fa517-8ca6-430e-b044-7fa7e9b339b8@20.426.45.305:43144' to '/mesos-data/slave-1/meta/slaves/81cb9c2a-d18b-4127-872b-2a5676dfb314-S0/frameworks/5175f6c9-0617-4145-ab46-3b7e64dc67ea-0000/framework.pid'
I0906 14:05:00.959430 9 slave.cpp:1785] Launching task 'ct:1504706700007:0:Job_Task_Test:' for framework 5175f6c9-0617-4145-ab46-3b7e64dc67ea-0000
I0906 14:05:00.966035 9 paths.cpp:547] Trying …Run Code Online (Sandbox Code Playgroud) Mesos slave无法将自身添加到群集中.现在我有3台机器,有3个从机运行,1个主机.
但是在mesos页面上,我只能看到一个主设备和一个从设备(与主设备主机相同).我可以看到马拉松跑,app等..但只是其他奴隶无法连接到主人.
奴隶日志::
I0825 21:30:00.971642 4110 slave.cpp:4193] Received oversubscribable resources from the resource estimator
I0825 21:30:01.000732 4106 group.cpp:313] Group process (group(1)@127.0.1.1:5051) connected to ZooKeeper
I0825 21:30:01.000821 4106 group.cpp:787] Syncing group operations: queue size (joins, cancels, datas) = (0, 0, 0)
I0825 21:30:01.000874 4106 group.cpp:385] Trying to create path '/mesos' in ZooKeeper
I0825 21:30:01.007753 4106 detector.cpp:138] Detected a new leader: (id='9')
I0825 21:30:01.008038 4106 group.cpp:656] Trying to get '/mesos/info_0000000009' in ZooKeeper
W0825 21:30:01.020577 4106 detector.cpp:444] Leading master master@127.0.1.1:5050 is using …Run Code Online (Sandbox Code Playgroud) mesos ×10
mesosphere ×10
docker ×3
amazon-vpc ×1
apache ×1
dcos ×1
gpgpu ×1
kubernetes ×1
marathon ×1
node.js ×1
terraform ×1
twitter ×1