小编Sin*_*dhu的帖子

DynamoDb PutItem与UpdateItem之间的区别?

基于DynamoDb文档,为什么有人会使用updateItem而不是putItem?

PutItem-将单个项目写入表格.如果表中存在具有相同主键的项,则该操作将替换该项.为了计算预配置的吞吐量消耗,重要的项目大小是两者中较大的一个.

UpdateItem-修改表中的单个项目.DynamoDB会在更新之前和之后考虑项目的大小.消耗的预配置吞吐量反映了这些项目大小中的较大者.即使您仅更新项目属性的子集,UpdateItem仍将消耗全部预配置吞吐量("之前"和"之后"项目大小中的较大者).

amazon-dynamodb

45
推荐指数
2
解决办法
2万
查看次数

更改 DataFrame 中嵌套列的值

我有带有两级嵌套字段的数据框

 root
 |-- request: struct (nullable = true)
 |    |-- dummyID: string (nullable = true)
 |    |-- data: struct (nullable = true)
 |    |    |-- fooID: string (nullable = true)
 |    |    |-- barID: string (nullable = true)
Run Code Online (Sandbox Code Playgroud)

我想在fooId这里更新列的值。我能够dummyID使用此问题作为参考更新第一级例如列的值如何将嵌套列添加到数据帧

输入数据:

{
    "request": {
        "dummyID": "test_id",
        "data": {
            "fooID": "abc",
            "barID": "1485351"
        }
    }
}
Run Code Online (Sandbox Code Playgroud)

输出数据:

{
    "request": {
        "dummyID": "test_id",
        "data": {
            "fooID": "def",
            "barID": "1485351"
        }
    }
}
Run Code Online (Sandbox Code Playgroud)

我如何使用 Scala 做到这一点?

scala dataframe apache-spark

3
推荐指数
1
解决办法
3723
查看次数

标签 统计

amazon-dynamodb ×1

apache-spark ×1

dataframe ×1

scala ×1