Spark数据集-强大的输入

Arv*_*mar 4 dataset apache-spark apache-spark-dataset

关于Spark数据集,什么是强类型API和无类型API?

数据集如何与数据帧相似/不同?

Vig*_*h I 6

数据框API是无类型的API,因为仅在运行时才知道类型。而数据集API是类型化的API,在编译期间将知道其类型。

df.select("device").where("signal > 10")      // using untyped APIs   
ds.filter(_.signal > 10).map(_.device)         // using typed APIs
Run Code Online (Sandbox Code Playgroud)