在另一列pyspark中创建具有字符串长度的列

use*_*463 3 python-2.7 pyspark

我在pyspark的数据框中有一个列,例如下面的“ Col1”。我想用“ Col1”中每个字符串的长度创建一个新列“ Col2”。我是pyspark的新手,我一直在Google搜索,但还没有看到任何有关如何执行此操作的示例。非常感谢任何提示。

例:

Col1 Col2
12   2
123  3
Run Code Online (Sandbox Code Playgroud)

Psi*_*dom 10

您可以使用以下length功能:

import pyspark.sql.functions as F
df.withColumn('Col2', F.length('Col1')).show()
+----+----+
|Col1|Col2|
+----+----+
|  12|   2|
| 123|   3|
+----+----+
Run Code Online (Sandbox Code Playgroud)