use*_*463 3 python-2.7 pyspark
我在pyspark的数据框中有一个列,例如下面的“ Col1”。我想用“ Col1”中每个字符串的长度创建一个新列“ Col2”。我是pyspark的新手,我一直在Google搜索,但还没有看到任何有关如何执行此操作的示例。非常感谢任何提示。
例:
Col1 Col2
12 2
123 3
Run Code Online (Sandbox Code Playgroud)
Psi*_*dom 10
您可以使用以下length功能:
import pyspark.sql.functions as F
df.withColumn('Col2', F.length('Col1')).show()
+----+----+
|Col1|Col2|
+----+----+
| 12| 2|
| 123| 3|
+----+----+
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
8515 次 |
| 最近记录: |