小编Fre*_*son的帖子

Amazon批处理作业进程队列

我正在使用AWS EC2实例进行生物信息学工作.我有一个(~1000)个大文件,应该使用EC2实例上的脚本进行处理,结果应该上传回S3存储桶.我想将作业(文件)分发给多个EC2实例,优先以现货价格开始.

我需要的是一个简单易用的排队系统(可能是AWS SQS或其他东西),它可以将作业分配到实例并在实例失败时重新启动作业(由于现货价格过高或其他原因).我研究过AWS SQS示例,但这些示例过于先进,通常涉及自动扩展和复杂的消息生成应用程序.

有人能从概念上指出如何以最简单的方式解决这个问题吗？AWS SQS这个简单应用的任何示例？应该如何启动一堆实例以及如何告诉他们收听队列？

对于每个输入文件,我的工作流程基本上都是这样

aws s3 cp s3://mybucket/file localFile ## Possibly streaming the file without copy
work.py --input localFile --output outputFile
aws s3 cp outputFile s3://mybucket/output/outputFile

Run Code Online (Sandbox Code Playgroud)

queue message-queue amazon-ec2 amazon-web-services

Fre*_*son

lucky-day

2
推荐指数

2
解决办法

3840
查看次数

标签统计

amazon-ec2 ×1

amazon-web-services ×1

message-queue ×1

queue ×1

Amazon批处理作业进程队列

标签 统计

小编Fre_son的帖子

标签统计