我目前正在尝试使用 EMR 使用笔记本分析一些数据。我遇到的问题是,当我使用 PySpark 内核时,我无法弄清楚如何包含特定的工件。具体来说,我试图通过简单地使用 --packages争论。我是否必须包含 Bootstrap 操作?我不完全确定我什至会在那里放什么。非常感激任何的帮助。
amazon-web-services amazon-emr pyspark pyspark-sql
amazon-emr ×1
amazon-web-services ×1
pyspark ×1
pyspark-sql ×1