小编Nel*_*le 的帖子

如何通过列名的前缀对 Spark 数据框进行子集化?

我的 Spark 数据帧df的列名称是:A_x1、A_x2、B_x1、B_x2、C_x1、C_x2。

如何使用前缀从df创建 3 个新的 Spark 数据帧?输出应如下所示:

  • 名为A_的数据框包含列 A_x1、A_x2、
  • 名为B_的数据框包含列 B_x1、B_x2、
  • 名为C_的数据帧包含列 C_x1、C_x2。

谢谢你!

prefixes apache-spark apache-spark-sql pyspark

1
推荐指数
1
解决办法
1160
查看次数