小编Him*_*jaj的帖子

我们如何在 pyspark 中组合两个数据框

我有两个数据集。那么我该如何组合这些数据集

df.show()

----+---+----+----+---+-----+-----+
|  _1| _2|  _3|  _4| _5|   _6|   _7|
+----+---+----+----+---+-----+-----+
|yyyy| mm|tmax|tmin| af| rain|  sun|
|1941|  1| ---| ---|---| 74.7|  ---|
|1941|  2| ---| ---|---| 69.1|  ---|
|1941|  3| ---| ---|---| 76.2|  ---|
|1941|  4| ---| ---|---| 33.7|  ---|
|1941|  5| ---| ---|---| 51.3|  ---|
|1941|  6| ---| ---|---| 25.7|  ---|
|1941|  7| ---| ---|---| 53.9|  ---|
|1941|  8| ---| ---|---| 91.8|  ---|
|1941|  9| ---| ---|---| 25.5|  ---|
|1941| 10| ---| ---|---|106.2|  ---|
|1941| 11| ---| ---|---| …
Run Code Online (Sandbox Code Playgroud)

pyspark

1
推荐指数
1
解决办法
3663
查看次数

标签 统计

pyspark ×1