Nir*_*mal 3 scala apache-spark apache-spark-sql apache-spark-2.0
我有两列年龄和薪水存储在DF中.我只想编写一个scala代码来逐列添加这些值.我试过了
val age_1 = df.select("age")
val salary_1=df.select("salary")
val add = age_1+salary_1
Run Code Online (Sandbox Code Playgroud)
给我错误.请帮忙
下面spark是一个实例SparkSession,因此进口有来后的实例spark.
这里可以通过导入spark implicits来使用$ -notation
import spark.implicits._
Run Code Online (Sandbox Code Playgroud)
然后使用$ -notation
val add = df.select($"age" + $"salary")
Run Code Online (Sandbox Code Playgroud)
最终的scala代码:
import spark.implicits._
val add = df.select($"age" + $"salary")
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
9898 次 |
| 最近记录: |