zol*_*oth 1 r apache-spark apache-spark-sql sparkr
我想知道是否有一种简洁的方法可以在SparkR中删除DataFrame的列,例如df.drop("column_name")在pyspark中.
这是我能得到的最接近的:
df <- new("DataFrame",
sdf=SparkR:::callJMethod(df@sdf, "drop", "column_name"),
isCached=FALSE)
Run Code Online (Sandbox Code Playgroud)
这可以通过为Spark数据帧列分配NULL来实现:
df$column_name <- NULL
Run Code Online (Sandbox Code Playgroud)
请参阅相关Spark JIRA票证的原始讨论.