我打开了一个 AWS EMR 集群,并在 pyspark3 jupyter notebook 中运行了以下代码:
"..
textRdd = sparkDF.select(textColName).rdd.flatMap(lambda x: x)
textRdd.collect().show()
.."
Run Code Online (Sandbox Code Playgroud)
我收到此错误:
An error was encountered:
Invalid status code '400' from http://..../sessions/4/statements/7 with error payload: {"msg":"requirement failed: Session isn't active."}
Run Code Online (Sandbox Code Playgroud)
运行线路:
sparkDF.show()
Run Code Online (Sandbox Code Playgroud)
作品!
我还创建了该文件的一小部分,并且我的所有代码都运行良好。
问题是什么?