我有一个函数可以对熊猫数据框进行分组。问题是我的数据框可以有可变数量的列。我想聚合:将最后一列与第一列相加。最后一列的名称不同,但第一列的名称是固定的。
我怎样才能达到这个组?我尝试使用 iloc 并使用 df.columns[-1] 获取最后一列的列名,但是,这些技巧似乎都不起作用。
有没有比将最后一列名称更改为某个通用值更好的方法来实现这一目标?
我是Spark的初学者。我正在使用Pyspark将旧的Python代码转换为Spark。
我想得到一个与下面的代码等效的Pyspark
usersofinterest = actdataall[actdataall['ORDValue'].isin(orddata['ORDER_ID'].unique())]['User ID']
Run Code Online (Sandbox Code Playgroud)
两者,actdataall并orddata有星火dataframes。
toPandas()考虑到与之相关的缺点,我不想使用函数。
任何帮助表示赞赏。