用于删除操作的 DynamoDB 流事件中的元数据？

Question

用于删除操作的 DynamoDB 流事件中的元数据？

JHH*_*JHH 3 amazon-dynamodb amazon-dynamodb-streams

我打算使用 DynamoDB 流来实现一个日志跟踪，跟踪对许多表的更改（并将其写入 S3 上的日志文件）。每当对表进行修改时，都会从流事件中调用 lambda 函数。现在，我需要记录进行修改的用户。对于putand update，我可以通过包含一个包含调用者 ID 的实际表属性来解决这个问题。现在存储在表中的记录将包含此 ID，这并不是真正可取的，因为它是有关操作的更多元数据而不是记录本身的一部分，但我可以接受。

例如：

put({
  TableName: 'fruits',
  Item: {
    id: 7,
    name: 'Apple',
    flavor: 'Delicious',
    __modifiedBy: 'USER_42'
  })

Run Code Online (Sandbox Code Playgroud)

这将导致 lambda 函数调用，我可以在其中将如下内容写入我的 S3 日志文件：

table: 'fruits',
operation: 'put',
time: '2018-12-10T13:35:00Z',
user: 'USER_42',
data: {
    id: 7,
    name: 'Apple',
    flavor: 'Delicious',
}

Run Code Online (Sandbox Code Playgroud)

但是，对于删除，出现了一个问题——如何记录删除操作的调用用户？当然，我可以发出两个请求，一个更新__modifiedBy，另一个删除项目，流只会__modifiedBy从OLD_IMAGE包含在流事件中的获取值。然而，这确实是不可取的，因为一次删除一个项目必须花费 2 次写入。

那么有没有更好的方法，例如将元数据附加到 DynamoDB 操作，这些方法会被转移到流事件中，而不是写入表本身的数据的一部分？

Answer 1

Mat*_*ope 5

这里有 3 个不同的选项。正确的将取决于您的应用程序的要求。可能这些方法都不适用于您的特定用例，但总的来说，这些方法都适用。

选项1

如果您在足够细的级别使用 AWS IAM，则可以从Stream Record获取用户身份。

选项 2

如果您在写入 dynamodb 时可以处理少量开销，则可以设置一个 lambda 函数（或基于 ec2 的服务），充当 dynamodb 表的写入代理。配置您的权限，以便只有 Lambda 可以写入表，然后您可以接受所需的任何元数据并根据需要记录它。如果您只需要记录事件，那么您无需写入 S3，因为 AWS 可以为您处理 Lambda 日志。

这是使用日志记录而不是写入 S3 的 lambda 函数的示例伪代码。

handle_event(operation, item, user)
    log(operation, item, user)
    switch operation
        case put:
             dynamodb.put(item)
        case update:
             dynamodb.update(item)
        case delete:
             dynamodb.delete(item)

log(operation, item, user)
    logEntry.time = now
    logEntry.user = user
    ...
    print(logEntry)

Run Code Online (Sandbox Code Playgroud)

当然，您仍然可以自由地直接登录到 S3，但如果这样做，您可能会发现增加的延迟足以影响您的应用程序。

选项 3

如果您可以容忍表中的一些陈旧数据，请在您的表上设置DynamoDB TTL。创建或更新项目时不要设置 TTL 值。然后不是删除一个项目，而是通过将当前时间添加到 TTL 字段来更新项目。据我所知，DynamoDB 在删除 TTL 过期的项目时不使用写入容量，过期的项目会在 24 小时到期后删除。

这将允许您将“添加 TTL”记录为删除，并有一个last modified by用户进行删除。您可以安全地忽略 dynamodb 清理过期项目时发生的实际删除。

在您的应用程序中，您还可以检查 TTL 值是否存在，这样您就不会意外向用户显示已删除的数据。您还可以向任何将省略具有 TTL 集的项目的查询添加过滤器表达式。

归档时间：	6 年，10 月前
查看次数：	3958 次
最近记录：	6 年，10 月前