我们可以使用boto3 Python在aws s3存储桶之间递归复制文件和文件夹吗?

Gow*_*avi 7 python amazon-s3 amazon-web-services boto3 aws-lambda

是否可以使用boto3将一个源存储桶中的所有文件复制到其他目标存储桶.而源存储桶没有常规的文件夹结构.

Source bucket: SRC
Source Path: A/B/C/D/E/F..
where in D folder it has some files,
E folder has some files

Target bucket: TGT
Target path: L/M/N/
Run Code Online (Sandbox Code Playgroud)

我需要使用boto3将SRC存储桶上方的所有文件和文件夹从文件夹C复制到N文件夹下的TGT存储桶.

任何人都可以知道任何API,或者我们是否需要编写新的python脚本来完成此任务.

moo*_*oot 22

S3存储对象,它不存储文件夹,甚至'/'或'\'是对象键名称的一部分.您只需要操纵密钥名称并复制数据.

import boto3
old_bucket_name = 'SRC'
old_prefix = 'A/B/C/'
new_bucket_name = 'TGT'
new_prefix = 'L/M/N/'
s3 = boto3.resource('s3')
old_bucket = s3.Bucket(old_bucket_name)
new_bucket = s3.Bucket(new_bucket_name)

for obj in old_bucket.objects.filter(Prefix=old_prefix):
    old_source = { 'Bucket': old_bucket_name,
                   'Key': obj.key}
    # replace the prefix
    new_key = obj.key.replace(old_prefix, new_prefix, 1)
    new_obj = new_bucket.Object(new_key)
    new_obj.copy(old_source)
Run Code Online (Sandbox Code Playgroud)

(更新)

正如@zvikico所指出的,在对象密钥中存在重复旧前缀的风险,例如new_key,被新前缀替换.这是一些修复

new_key = new_prefix + obj.key[len(old_prefix):]
Run Code Online (Sandbox Code Playgroud)