小编Der*_*rik的帖子

AWS Glue - 不知道如何将 NullType 保存到 REDSHIFT

我有以下用于 AWS Glue 的简单脚本。我有一个包含空单元格的文本文件和一个接受 NULL 值的表。当我运行粘合作业时,它失败并出现异常:“不知道如何将 NullType 保存到 REDSHIFT”。

我该如何处理这个问题,或者 RedShift 通过 Glue 不支持 NULL 插入?

作业脚本:

import sys
from awsglue.transforms import *
from awsglue.utils import getResolvedOptions
from pyspark.context import SparkContext
from awsglue.context import GlueContext
from awsglue.job import Job

## @params: [TempDir, JOB_NAME]
args = getResolvedOptions(sys.argv, ['TempDir','JOB_NAME'])

sc = SparkContext()
glueContext = GlueContext(sc)
spark = glueContext.spark_session
job = Job(glueContext)
job.init(args['JOB_NAME'], args)
## @type: DataSource
## @args: [database = "poc_edw", table_name = "delta_orderheader", transformation_ctx = "datasource0"]
## @return: datasource0
## @inputs: …
Run Code Online (Sandbox Code Playgroud)

etl python-3.x amazon-redshift aws-glue

6
推荐指数
1
解决办法
6566
查看次数

标签 统计

amazon-redshift ×1

aws-glue ×1

etl ×1

python-3.x ×1