Eli*_*eth 1 python loops dataframe pandas
所以我尝试交织大约 3 个数据帧,结果应该如下所示:
df1
A
D
G
Run Code Online (Sandbox Code Playgroud)
df2
B
E
H
Run Code Online (Sandbox Code Playgroud)
df3
C
F
I
Run Code Online (Sandbox Code Playgroud)
结果 df:
A
B
C
D
E
F
G
H
I
Run Code Online (Sandbox Code Playgroud)
我试过:
for i in len(df1+df2+df3):
final_df.append(i)
Run Code Online (Sandbox Code Playgroud)
我想尽可能高效地使用 n 个数据帧来完成此操作
小智 5
您可以简单地将所有数据框放入列表中,然后unionAll对它们执行操作,如下所示:
from functools import reduce
from pyspark.sql import DataFrame
dfs = [df1,df2,df3]
df = reduce(DataFrame.unionAll, dfs)
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
2941 次 |
| 最近记录: |