boto3:启用 CDN 时如何与 DigitalOcean S3 Spaces 交互

art*_*ski 5 python cdn amazon-s3 digital-ocean boto3

我正在使用 DigitalOcean Spaces (S3 存储协议),它启用了CDN

s3 上的任何文件都可以通过给定形式的直接 URL 访问:

https://my-bucket.fra1.digitaloceanspaces.com/<file_key>
Run Code Online (Sandbox Code Playgroud)

如果启用CDN ,则可以通过附加 CDN URL 访问该文件:

https://my-bucket.fra1.cdn.digitaloceanspaces.com/<file_key>
Run Code Online (Sandbox Code Playgroud)

其中fra1region_name

当我使用boto3SDK for Python 时,文件 URL 如下(由 boto3 生成):

https://fra1.digitaloceanspaces.com/my-bucket/<file_key>
# just note that bucket name is no more a domain part!
Run Code Online (Sandbox Code Playgroud)

这种格式也可以正常工作。

但是,如果启用 CDN - 文件 url 会导致错误:

EndpointConnectionError: Could not connect to the endpoint URL:  https://fra1.cdn.digitaloceanspaces.com/my-bucket/<file_key>
Run Code Online (Sandbox Code Playgroud)

假设端点_url 已更改为

default_endpoint=https://fra1.digitaloceanspaces.com

default_endpoint=https://fra1.cdn.digitaloceanspaces.com

如何使用正确的 URL 连接到 CDN 而不会出现错误?为什么 boto3 使用不同的 URL 格式?在这种情况下可以应用任何解决方法吗?

代码:

s3_client = boto3.client('s3',
                            region_name=s3_configs['default_region'],
                            endpoint_url=s3_configs['default_endpoint'],
                            aws_access_key_id=s3_configs['bucket_access_key'],
                            aws_secret_access_key=s3_configs['bucket_secret_key'])

s3_client.download_file(bucket_name,key,local_filepath)
Run Code Online (Sandbox Code Playgroud)

DigitalOcean Spaces 的boto3指南。

这是我也尝试过但没有成功的方法:

更新 基于@Amit Singh 的回答:

正如我之前提到的,我已经使用预签名 URL 尝试过这个技巧。我有这样的网址

https://fra1.digitaloceanspaces.com/<my-bucket>/interiors/uploaded/images/07IRgHJ2PFhVqVrJDCIpzhghqe4TwK1cSSUXaC4T.jpeg?<presigned-url-params>
Run Code Online (Sandbox Code Playgroud)

存储桶名称出现在端点之后。我必须手动将其移动到域级别:

https://<my-bucket>.fra1.cdn.digitaloceanspaces.com/interiors/uploaded/images/07IRgHJ2PFhVqVrJDCIpzhghqe4TwK1cSSUXaC4T.jpeg?<presigned-url-params>
Run Code Online (Sandbox Code Playgroud)

使用此 URL,我现在可以连接到 Digital ocean,但出现另一个错误:

This XML file does not appear to have any style information associated with it. The document tree is shown below.
<Error>
<Code>SignatureDoesNotMatch</Code>
<RequestId>tx00000000000008dfdbc88-006005347c-604235a-fra1a</RequestId>
<HostId>604235a-fra1a-fra1</HostId>
</Error>
Run Code Online (Sandbox Code Playgroud)

作为一种解决方法,我厌倦了使用签名s3v4

    s3_client = boto3.client('s3',
                                 region_name=configs['default_region'],
                                 endpoint_url=configs['default_endpoint'],
                                 aws_access_key_id=configs['bucket_access_key'],
                                 aws_secret_access_key=configs['bucket_secret_key'],
                                 config= boto3.session.Config(signature_version='s3v4'))
Run Code Online (Sandbox Code Playgroud)

但它仍然失败。

Ami*_*ngh 6

boto3是 Amazon S3 的客户端库,而不是 Digital Ocean Spaces。因此,boto3将无法识别 CDN URL fra1.cdn.digitaloceanspaces.com,因为它是由 Digital Ocean 提供的,并且带有 CDN 的 URL 不是受支持的 URI 模式之一。我不完全了解 CDN 内部是如何工作的,所以我猜测实施此重定向以正确的 URL 可能会遇到挑战。

现在一切都清楚了,让我们看看如何获​​取预签名的 CDN URL。假设您的 CDN URL 是https://fra1.cdn.digitaloceanspaces.com,您的空间名称是my-spacemy-example-object我们想要获取空间中存储的对象的预签名 URL 。

import os
import boto3
from botocore.client import Config

# Initialize the client
session = boto3.session.Session()
client = session.client('s3',
                        region_name='fra1',
                        endpoint_url='https://fra1.digitaloceanspaces.com', # Remove `.cdn` from the URL
                        aws_access_key_id=os.getenv('SPACES_KEY'),
                        aws_secret_access_key=os.getenv('SPACES_SECRET'),
                        config=Config(s3={'addressing_style': 'virtual'}))

# Get a presigned URL for object 
url = client.generate_presigned_url(ClientMethod='get_object',
                                    Params={'Bucket': 'my-space',
                                            'Key': 'my-example-object'},
                                    ExpiresIn=300)

print(url)
Run Code Online (Sandbox Code Playgroud)

预签名 URL 将类似于:

https://my-space.fra1.digitaloceanspaces.com/my-example-object?AWSAccessKeyId=EXAMPLE7UQOTHDTF3GK4&Content-Type=text&Expires=1580419378&Signature=YIXPlynk4BALXE6fH7vqbnwjSEw%3D
Run Code Online (Sandbox Code Playgroud)

如果您需要,可以手动或以编程方式添加cdn中间内容,这样您的最终 URL 将变为:

https://my-space.fra1.cdn.digitaloceanspaces.com/my-example-object?AWSAccessKeyId=EXAMPLE7UQOTHDTF3GK4&Content-Type=text&Expires=1580419378&Signature=YIXPlynk4BALXE6fH7vqbnwjSEw%3D
Run Code Online (Sandbox Code Playgroud)

这是您的 CDN 网址。


art*_*ski 1

根据@Amit Singh 的回答,我对这个问题进行了额外的研究。

在这里这里找到了对我有帮助的答案。

为了使 boto3 预签名 URL 正常工作,我对clientgenerate_presigned_url()params 进行了以下更新。

s3_client = boto3.client('s3',
                         region_name=configs['default_region'],
                         endpoint_url=configs['default_endpoint'],
                         aws_access_key_id=configs['bucket_access_key'],
                         aws_secret_access_key=configs['bucket_secret_key'],
                         config=boto3.session.Config(signature_version='s3v4', retries={
                             'max_attempts': 10,
                             'mode': 'standard'
                         },
                         s3={'addressing_style': "virtual"}, ))
...

response = s3_client.generate_presigned_url('get_object',
                                            Params={'Bucket': bucket_name,
                                                    'Key': object_name},
                                            ExpiresIn=3600,
                                            HttpMethod=None
                                            )
Run Code Online (Sandbox Code Playgroud)

之后,.cdn应在区域名称后添加域部分。