以下代码仅在存在与该字段相关的值时才更新特定字段.
它返回一组不完整的值.数百万行是正确的,但数千行的值错误地设置为NULL.
这是SQL限制,还是我错过了什么?
UPDATE a
SET ResultType1 = CASE WHEN b.[Type] = 'type1' THEN b.value END
,ResultType2 = CASE WHEN b.[Type] = 'type2' THEN b.value END
FROM tableA AS a
INNER JOIN tableB AS b ON a.ID = b.ID
Run Code Online (Sandbox Code Playgroud) 我有一个 EMR 集群 (v5.12.1) 和我的 S3 存储桶设置,并使用相同的 AWS SSE-KMS 密钥进行静态加密。
从 S3 读取数据工作正常,但当我使用 Pyspark 脚本写入 S3 存储桶时 - parquet 文件使用默认的“aws/s3”密钥进行加密。
如何让 Spark 使用正确的 KMS 密钥?
集群有Hadoop 2.8.3和Spark 2.2.1