相关疑难解决方法(0)

将Spark DataFrame从Python移动到Scala,而不是Zeppelin

我在Zeppelin的Python段落中创建了一个spark DataFrame.

sqlCtx = SQLContext(sc)
spDf = sqlCtx.createDataFrame(df)
Run Code Online (Sandbox Code Playgroud)

并且df是一个熊猫数据帧

print(type(df))
<class 'pandas.core.frame.DataFrame'>
Run Code Online (Sandbox Code Playgroud)

我想要做的是spDf从一个Python段落转到另一个Scala段落.看起来合理的方法是使用z.put.

z.put("spDf", spDf)
Run Code Online (Sandbox Code Playgroud)

我收到了这个错误:

AttributeError: 'DataFrame' object has no attribute '_get_object_id'
Run Code Online (Sandbox Code Playgroud)

有任何修复错误的建议吗?或任何移动的建议spDf

python scala apache-spark apache-spark-sql apache-zeppelin

5
推荐指数
1
解决办法
4338
查看次数