小编Dus*_*sty的帖子

使用正则表达式检查多个列中是否有任何大于零的列

我需要在多列上应用when 函数。我想检查是否至少有一列的值大于 0。

这是我的解决方案:

df.withColumn("any value", F.when(
   (col("col1") > 0) |
   (col("col2") > 0) |
   (col("col3") > 0) |
   ...
   (col("colX") > 0)
   , "any greater than 0").otherwise(None))
Run Code Online (Sandbox Code Playgroud)

是否可以使用正则表达式执行相同的任务,这样我就不必编写所有列名称?

apache-spark apache-spark-sql pyspark

2
推荐指数
1
解决办法
2212
查看次数

标签 统计

apache-spark ×1

apache-spark-sql ×1

pyspark ×1