小编adi*_*nco的帖子

Pyspark:相当于 np.where

Pyspark 中这个操作的等价物是什么?

import pandas as pd
import numpy as np

df = pd.DataFrame({'Type':list('ABBC'), 'Set':list('ZZXY')})
df['color'] = np.where(df['Set']=='Z', 'green', 'red')
print(df)
Run Code Online (Sandbox Code Playgroud)

输出

   Set Type  color
0   Z    A  green
1   Z    B  green
2   X    B    red
3   Y    C    red
Run Code Online (Sandbox Code Playgroud)

pandas pyspark

7
推荐指数
1
解决办法
3521
查看次数

如何使用Pyspark将数据框保存到泡菜文件

我必须将数据框保存到Pickle文件中,但是会返回错误

df.saveAsPickleFile(path)
Run Code Online (Sandbox Code Playgroud)

AttributeError:“ Dataframe”对象没有属性“ saveAsPickleFile”

pickle pyspark

2
推荐指数
1
解决办法
3907
查看次数

标签 统计

pyspark ×2

pandas ×1

pickle ×1