相关疑难解决方法(0)

如何使用指定的架构创建空DataFrame?

我想DataFrame在Scala中使用指定的模式创建.我曾尝试使用JSON读取(我的意思是读取空文件),但我认为这不是最好的做法.

scala dataframe apache-spark apache-spark-sql

79
推荐指数
3
解决办法
12万
查看次数

Scala:如何组合两个数据框?

第一个 Df 是:

ID Name ID2 Marks
1   12    1   333
Run Code Online (Sandbox Code Playgroud)

第二个 Df2 是:

ID Name ID2 Marks
1         3   989
7   98    8   878
Run Code Online (Sandbox Code Playgroud)

我需要的输出是:

ID Name ID2 Marks
1   12    1   333
1         3   989
7   98    8   878
Run Code Online (Sandbox Code Playgroud)

请帮助!

scala apache-spark apache-spark-sql

5
推荐指数
1
解决办法
1万
查看次数

Union只能在具有兼容列类型Spark数据帧的表上执行

这是我的联盟代码:

val dfToSave=dfMainOutput.union(insertdf.select(dfMainOutput).withColumn("FFAction", when($"FFAction" === "O" || $"FFAction" === "I", lit("I|!|")))
Run Code Online (Sandbox Code Playgroud)

当我结合时,我得到以下错误:

org.apache.spark.sql.AnalysisException: Union can only be performed on tables with the compatible column types. string <> boolean at the 11th column of the second table;;
'Union
Run Code Online (Sandbox Code Playgroud)

这是两个数据帧的模式:

insertdf.printSchema()
root
 |-- OrganizationID: long (nullable = true)
 |-- SourceID: integer (nullable = true)
 |-- AuditorID: integer (nullable = true)
 |-- AuditorOpinionCode: string (nullable = true)
 |-- AuditorOpinionOnInternalControlCode: string (nullable = true)
 |-- AuditorOpinionOnGoingConcernCode: string (nullable = true)
 |-- IsPlayingAuditorRole: boolean (nullable …
Run Code Online (Sandbox Code Playgroud)

union scala dataframe apache-spark apache-spark-sql

2
推荐指数
1
解决办法
5093
查看次数

标签 统计

apache-spark ×3

apache-spark-sql ×3

scala ×3

dataframe ×2

union ×1