小编Mik*_*ike的帖子

Spark sql dataframe 在连接后从别名表中删除所有列

我正在尝试连接两个具有相同列名的数据框并计算一些新值。之后我需要删除第二个表的所有列。列的数量是巨大的。我怎样才能以更简单的方式做到这一点?我尝试 .drop("table2.*"),但这不起作用。

apache-spark

8
推荐指数
1
解决办法
6209
查看次数

Spark Dataframe更改列值

我得到了一些170列的数据帧.在一列中,我有一个"名称"字符串,当我将它们写入Postgres时,这个字符串有时会有一些特殊符号,如"'",这些符号是不合适的.我可以做那样的事情:

Df[$'name']=Df[$'name'].map(x => x.replaceAll("'","")) ?
Run Code Online (Sandbox Code Playgroud)

我不想解析完整的DataFrame,因为它非常庞大.请帮助我

scala dataframe apache-spark

6
推荐指数
2
解决办法
2万
查看次数

标签 统计

apache-spark ×2

dataframe ×1

scala ×1