如何在Spark Scala中将行数据转置/透视到列？

Vik*_*ane 3 pivot scala apache-spark apache-spark-sql

我是Spark-SQL的新手。我在Spark Dataframe中有这样的信息

Company Type Status
A       X    done
A       Y    done
A       Z    done
C       X    done
C       Y    done
B       Y    done

Run Code Online (Sandbox Code Playgroud)

我想像下面这样显示

Company X-type Y-type Z-type
A       done    done    done
B       pending done    pending
C       done    done    pending

Run Code Online (Sandbox Code Playgroud)

我无法实现这是Spark-SQL

请帮忙

您可以groupby 公司，然后pivot在列类型上使用功能

这是简单的例子

import org.apache.spark.sql.functions._ val df = spark.sparkContext.parallelize(Seq( ("A", "X", "done"), ("A", "Y", "done"), ("A", "Z", "done"), ("C", "X", "done"), ("C", "Y", "done"), ("B", "Y", "done") )).toDF("Company", "Type", "Status") val result = df.groupBy("Company") .pivot("Type") .agg(expr("coalesce(first(Status), \"pending\")")) result.show()
Run Code Online (Sandbox Code Playgroud)
输出：

+-------+-------+----+-------+ |Company| X| Y| Z| +-------+-------+----+-------+ | B|pending|done|pending| | C| done|done|pending| | A| done|done| done| +-------+-------+----+-------+
Run Code Online (Sandbox Code Playgroud)
您可以稍后重命名该列。

希望这可以帮助！

归档时间：

8 年，2 月前

查看次数：

5827 次

最近记录：

7 年，2 月前

如何转动DataFrame？ 52

如何转动DataFrame？ 52
更多相关链接

相关归档

Scala PartialFunction可以是Monoid吗？ 14

使用IntelliJ在Android上使用Scala编写的LibGDX项目 9

为什么scaladoc方法签名错误？ 8

PySpark:在RDD中使用Object 7

关于implicits的奇怪错误消息 6

旋转 1300 万条记录时，tempDB 在 SQL Server 中已满，旋转需要超过 28 小时 6

列到SQL服务器中的行？ 5

如何通过.map在另一个RDD中传递一个RDD 5

Hive SQL上的Spark查询错误NoSuchFieldError：HIVE_STATS_JDBC_TIMEOUT 5

为什么spark中union()是窄变换而intersection()是宽变换？ 3

难疑归档

如何在Linux上找到包含特定文本的所有文件？ 4914

如何将空目录添加到Git存储库？ 4039

在JavaScript中创建GUID/UUID？ 3915

在jQuery中添加表行 2331

如何在Windows上找出正在侦听端口的进程？ 2040

SCSS和Sass有什么区别？ 1760

Dockerfile中CMD和ENTRYPOINT有什么区别？ 1484

为什么要使用getter和setter/accessors？ 1472

\ d效率低于[0-9] 1214

如何使用$ scope.$ watch和$ scope.$在AngularJS中申请？ 1076

Copyright Info

© Copyright 2013-2021 admin@qa.1r1g.com

如未特别说明，本网站的内容使用如下协议:
Creative Commons Atution-NonCommercial-ShareAlike 4.0 International license.

用以下方式浏览

大分类

日期

标签

参考资料

qa.1r1g.com

superuser

askubuntu

unix

dba

serverfault

www website

回到顶部

网安备44200002443738

粤ICP备19038133号