我在Zeppelin的Python段落中创建了一个spark DataFrame.
sqlCtx = SQLContext(sc)
spDf = sqlCtx.createDataFrame(df)
Run Code Online (Sandbox Code Playgroud)
并且df是一个熊猫数据帧
print(type(df))
<class 'pandas.core.frame.DataFrame'>
Run Code Online (Sandbox Code Playgroud)
我想要做的是spDf从一个Python段落转到另一个Scala段落.看起来合理的方法是使用z.put.
z.put("spDf", spDf)
Run Code Online (Sandbox Code Playgroud)
我收到了这个错误:
AttributeError: 'DataFrame' object has no attribute '_get_object_id'
Run Code Online (Sandbox Code Playgroud)
有任何修复错误的建议吗?或任何移动的建议spDf?