我必须将数据框保存到Pickle文件中,但是会返回错误
df.saveAsPickleFile(path)
Run Code Online (Sandbox Code Playgroud)
AttributeError:“ Dataframe”对象没有属性“ saveAsPickleFile”
saveAsPickleFile是RDD不是数据帧的方法。
请参阅以下文档:http : //spark.apache.org/docs/latest/api/python/pyspark.html?highlight=pickle
因此,您可以致电:
df.rdd.saveAsPickleFile(filename)
Run Code Online (Sandbox Code Playgroud)
要从文件加载它,请运行:
pickleRdd = sc.pickleFile(filename).collect()
df2 = spark.createDataFrame(pickleRdd)
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
3907 次 |
| 最近记录: |