mig*_*use 1 amazon-web-services dataframe apache-spark apache-spark-sql aws-glue
在 AWS Glue 中,我从胶水动态框架中的数据目录中读取数据。然后将动态帧转换为火花数据帧以应用模式转换。为了将数据写回 s3,我看到开发人员将数据帧转换回动态帧。写一个胶水动态帧比写一个火花数据帧有什么优势吗?
您会发现有一些功能仅适用于使用数据帧时无法访问的动态帧编写器类:
from_jdbc_confglueparquet作为格式写入镶木地板。这些是我能想到的一些用例,但如果您有一个需要使用保存模式的用例,例如,mode('overwrite')您可以使用数据框。然而,动态框架中存在类似的方法,但实现方式略有不同。你可以看看[purge_s3_path][3]然后写。