小编clo*_*nja的帖子

带有"^ A"分隔符的Redshift COPY命令

我试图使用控件A("^ A")分隔文件加载到使用COPY命令的redshift,我看到默认分隔符是管道(|)和CSV是逗号.

我无法提交使用方式^A,当我尝试使用^A或使用COPY命令时\x01,它会抛出以下消息.以前有人试过吗?文档说我们可以使用分隔符,但没有使用的线索^A.

密码:错误:COPY分隔符必须是单个字符

amazon-s3 delimiter amazon-web-services emr amazon-redshift

5
推荐指数
1
解决办法
3563
查看次数

使用Snappy压缩的Parquet格式的Redshift COPY命令

我在HDFS中有数据集,它采用镶木地板格式,并且有snappy作为压缩编解码器.就我的研究而言,目前Redshift只接受带有gzip,lzo压缩编解码器的纯文本,json,avro格式.

或者,我正在将镶木地板格式转换为纯文本,并使用Pig脚本将snappy编解码器更改为gzip.

目前有没有办法直接从镶木地板文件加载数据到Redshift?

compression amazon-s3 snappy amazon-redshift parquet

5
推荐指数
1
解决办法
1万
查看次数