Apache Airflow 版本:v2.1.1
Kubernetes 版本(如果您使用 kubernetes)(使用 kubectl 版本):- 客户端版本:version.Info{Major:"1", Minor:"21", GitVersion:"v1.21.2", GitCommit:"092fbfbf53427de67cac1e9fa54aaa09a28371d7", GitTreeState :"clean", BuildDate:"2021-06-16T12:52:14Z", GoVersion:"go1.16.5", 编译器:"gc", Platform:"darwin/amd64"} 服务器版本: version.Info{Major: “1”,次要:“19+”,GitVersion:“v1.19.8-eks-96780e”,GitCommit:“96780e1b30acbf0a52c38b6030d7853e575bcdf3”,GitTreeState:“干净”,BuildDate:“2021-03-10T21:32:29Z”,GoVersion :“go1.15.8”,编译器:“gc”,平台:“linux/amd64”}
环境:开发
云提供商或硬件配置: AWS EKS 操作系统(例如来自 /etc/os-release): 内核(例如 uname -a): 安装工具: 其他: 发生了什么: 我无法使用 SparkKubernetesOperator 在 Kubernetes 集群上创建 SparkApplications气流 DAG。我在 EKS 上托管了 Airflow 和 Spark-operator。我已经在 Airflow 上创建了一个连接,通过使用“集群配置”来连接到 Kubernetes 集群。我只是运行示例应用程序只是为了通过 Airflow 检查 Kubernetes 上 Spark 的执行情况。
应用程序 YAML 文件:-
apiVersion: "sparkoperator.k8s.io/v1beta2"
kind: SparkApplication
metadata:
name: spark-pi-airflow
namespace: spark-apps
spec:
type: Scala
mode: cluster
image: "gcr.io/spark-operator/spark:v3.1.1"
imagePullPolicy: Always
mainClass: org.apache.spark.examples.SparkPi
mainApplicationFile: …Run Code Online (Sandbox Code Playgroud)