在SparkR中删除DataFrame的列

zol*_*oth 1 r apache-spark apache-spark-sql sparkr

我想知道是否有一种简洁的方法可以在SparkR中删除DataFrame的列,例如df.drop("column_name")pyspark中.

这是我能得到的最接近的:

df <- new("DataFrame",
          sdf=SparkR:::callJMethod(df@sdf, "drop", "column_name"),
          isCached=FALSE)
Run Code Online (Sandbox Code Playgroud)

zol*_*oth 7

这可以通过为Spark数据帧列分配NULL来实现:

df$column_name <- NULL
Run Code Online (Sandbox Code Playgroud)

请参阅相关Spark JIRA票证的原始讨论.