来自具有 S3 源的 AWS CloudFront 的文件没有缓存控制标头

jar*_*vis 32 cache amazon-s3 cdn amazon-cloudfront amazon-web-services

我们刚刚迁移到亚马逊 AWS。我们目前有一个运行良好的 EC2 实例。它在前端运行 Nginx,在后端运行 Apache。这也运行良好。所有站点都已正确启动,并包含从 EC2 提供的文件的 Cache-Control 标头。

问题在于我们放置在Amazon S3中的所有静态文件都是通过CloudFront CDN访问的。我们可以正常访问文件(并且 CORS 没有问题),但显然CloudFront 不提供带有 Cache-Control 标头的文件。我们想利用浏览器缓存。

在我看来,EC2 实例在这里不起作用,因为静态文件由 S3+CloudFront 直接提供,请求不会转到 EC2 中的 Web 服务器。

我完全迷失了。

问题:1)在这种情况下如何设置Cache-Control?2)是否可以设置Cache-Control?从 S3 还是 CloudFront?

注意:我在 Google 中找到了几个页面,您可以在其中为单个对象设置 S3 中的 Header。这真的不是一种特别有效的方法,因为在我的情况下,我们正在谈论几个对象。

谢谢!

Mic*_*bot 40

我已经在 Google 中找到了几个页面,您可以在其中为单个对象设置 S3 中的 Header。这真的不是一种特别有效的方法,因为在我的情况下,我们正在谈论几个对象。

好吧,无论是否“富有成效”,这就是它实际设计的工作方式。

CloudFront 不添加 Cache-Control:标头。

CloudFront传递 (并尊重,除非另有配置)Cache-Control:源服务器提供的标头,在本例中为 S3。

要在获取Cache-Control:对象时获取 S3 提供的 headers,必须在对象上传到 S3 时提供它们,或者通过后续的 put+copy 操作添加到对象的元数据中,该操作可用于在内部将对象复制到自身中S3,修改过程中的元数据。如果您编辑对象元数据,这就是控制台在幕后所做的事情。

还有(如果您想知道的话)S3 中没有全局设置来强制存储桶中的所有对象返回这些标头——它是每个对象的属性。


更新: Lambda@Edge 是 CloudFront中的一项新功能,允许您针对请求和/或响应触发触发器,在查看器和缓存和/或缓存和源之间,针对简单的请求/响应对象结构运行用 Node.js 编写的代码由 CloudFront 公开。

此功能的主要应用程序之一是操作标头……因此,虽然上述内容仍然准确——CloudFront 本身并未添加Cache-Control——但 Lambda 函数现在可以将它们添加到从 CloudFront 返回的响应中。

此示例Cache-Control: public, max-age=86400Cache-Control在响应中不存在标头时才添加。

在源响应触发器中使用此代码会导致每次 CloudFront 从源获取对象时触发它,并在 CloudFront 缓存它之前修改响应。

'use strict';

exports.handler = (event, context, callback) => {
    const response = event.Records[0].cf.response;

    if(!response.headers['cache-control'])
    {
        response.headers['cache-control'] = [{ 
            key:   'Cache-Control', 
            value: 'public, max-age=86400' 
        }];
    }

    callback(null, response);
};
Run Code Online (Sandbox Code Playgroud)

更新(2018-06-20):最近,我向 CloudFront 团队提交了一个功能请求,允许将静态源响应标头配置为源属性,类似于添加静态请求标头的方式,现在...扭曲,允许将每个标头配置为有条件地添加(仅当源未在响应中提供该标头时)或无条件地添加(添加标头并覆盖来自原点的标头,如果存在)。

对于功能请求,您通常不会收到任何关于他们是否真的在考虑实施新功能的确认……或者甚至他们是否可能已经在开发新功能……这只是在他们完成后宣布。所以,我不知道这些是否会实施。有一个论点是,由于此功能已通过 Lambda@Edge 可用,因此基本功能中不需要它……但我的反驳论点是,基本功能在没有功能的情况下不是功能完整的做简单的、静态的响应头操作,如果这是需要触发器的唯一原因,那么需要 Lambda 触发器是不必要的成本,经济上和增加的延迟(即使两者都不一定是古怪的成本)。

  • 塔达,确实,@Kunal。这是我在答案中提到的一个示例:*“通过后续的 put+copy 操作添加到对象的元数据中。”* 谨慎使用它并进行测试,因为有一些警告。它将重置您的所有日期戳,并可能对加密产生影响。它还可能将对象 etag 从多部分格式更改为单部分格式,这是一种不同的算法,并且会使任何在其他地方存储 etag 以便将来进行完整性检查的系统感到困惑。如果在存储桶上启用版本控制,您的存储成本将加倍,除非您清理旧版本。 (2认同)