Spark SQL - DataFrame - 选择 - 转换还是操作?

pet*_*rov 5 java apache-spark

在 Spark SQL(使用 Java API)中,我有一个DataFrame.

DataFrame有一个select方法。我想知道这是一种转变还是一种行动?

我只需要一个确认和一个很好的参考,它清楚地说明了这一点。

Nik*_*hil 7

是转变。请参考:https : //spark.apache.org/docs/2.0.0/api/java/org/apache/spark/sql/Dataset.html

数据集是特定领域对象的强类型集合,可以使用函数或关系操作并行转换。每个 Dataset 也有一个无类型视图,称为 DataFrame,它是一个 Dataset of Row。

数据集上可用的操作分为转换和操作。转换是产生新数据集的那些,而动作是触发计算和返回结果的那些。示例转换包括映射、过滤器、选择和聚合 (groupBy)。示例操作计数、显示或将数据写入文件系统。