Arv*_*mar 4 dataset apache-spark apache-spark-dataset
关于Spark数据集,什么是强类型API和无类型API?
数据集如何与数据帧相似/不同?
数据框API是无类型的API,因为仅在运行时才知道类型。而数据集API是类型化的API,在编译期间将知道其类型。
df.select("device").where("signal > 10") // using untyped APIs
ds.filter(_.signal > 10).map(_.device) // using typed APIs
Run Code Online (Sandbox Code Playgroud)