我有数据框,我需要在Pyspark中按行计算非零列的数量。
ID COL1 COL2 COL3
1 0 1 -1
2 0 0 0
3 -17 20 15
4 23 1 0
Run Code Online (Sandbox Code Playgroud)
预期产量:
ID COL1 COL2 COL3 Count
1 0 1 -1 2
2 0 0 0 0
3 -17 20 15 3
4 23 1 0 1
Run Code Online (Sandbox Code Playgroud) pyspark ×1