相关疑难解决方法(0)

Pyspark:通过搜索字典替换列中的值

我是 PySpark 的新手。

我有一个DataFrame df包含“device_type”列的 Spark 。

我想将“平板电脑”或“电话”中的每个值替换为“电话”,并将“PC”替换为“桌面”。

在 Python 中,我可以执行以下操作,

deviceDict = {'Tablet':'Mobile','Phone':'Mobile','PC':'Desktop'}
df['device_type'] = df['device_type'].replace(deviceDict,inplace=False)
Run Code Online (Sandbox Code Playgroud)

如何使用 PySpark 实现这一目标?谢谢!

python dataframe apache-spark apache-spark-sql pyspark

9
推荐指数
5
解决办法
2万
查看次数