小编Zei*_*ein的帖子

对数据帧中的行重新排序以匹配另一个数据帧中的行顺序

我有 2 个数据帧 df1 和 df2,它们具有相同的行数,但顺序不同。数据帧有一个 ID 列,其中包含每行的唯一标识符,两个数据帧都有此 ID 列,这是我希望 df2 中的行顺序与 df1 中的匹配的列。我希望顺序相同的原因是数据帧将传递给 sklearn train_test_split 并且我希望以完全相同的顺序拆分数据帧。我怎样才能做到这一点?

这是第一个数据框:

df1

Paper ID          Document       Label 
math.123.txt    df1 content 1      0
math.321.txt    df1 content 2      0
math.213.txt    df1 content 3      0

df2

Paper ID         Document        Label 
math.123.txt     df2 content 1         0
math.213.txt     df2 content 2         0
math.321.txt     df2 content 3         0

Run Code Online (Sandbox Code Playgroud)

df2 所需的顺序:

df2

Paper ID         Document            Label 
math.123.txt     df2 content 1         0
math.321.txt     df2 content 3         0
math.213.txt     df2 content 2         0 …
Run Code Online (Sandbox Code Playgroud)

python pandas scikit-learn sklearn-pandas

2
推荐指数
1
解决办法
2169
查看次数

标签 统计

pandas ×1

python ×1

scikit-learn ×1

sklearn-pandas ×1