小编Ter*_*tyl的帖子

写入 Hive 分区时 Spark 暂存目录竞争条件？

尝试将数据集写入配置单元表中的分区时，我看到间歇性异常。

Caused by: org.apache.hadoop.fs.FileAlreadyExistsException: /user/hive/warehouse/devl_fr9.db/fr9_ftdelivery_cpy_2_4d8eebd3_9691_47ce_8acc_b2a5123dabf6/.spark-staging-d996755c-eb81-4362-a393-31e8387104f0/date_id=20180604/part-00000-d996755c-eb81-4362-a393-31e8387104f0.c000.snappy.parquet for client 10.56.219.20 already exists

如果我检查 HDFS，相关路径不存在。我只能假设这是有关临时暂存文件的一些竞争条件。我使用的是 Spark 2.3

hive apache-spark apache-spark-sql

Ter*_*tyl

lucky-day

5
推荐指数

1
解决办法

1521
查看次数