我有一个充满配置文件的文件,如下所示:
profile_id colA colB colC colD
1 1 20 50 63
2 1 20 65 38
3 8 5 3 4
4 98 1 878 4
...
Run Code Online (Sandbox Code Playgroud)
我有另一个 CSV 文件,其中包含我想要查找个人资料的结果:
col value score
colA 1 85
colA 1 856
colA 8 200000
colB 1 2356
colC 878 99999
colD 4 2
...
Run Code Online (Sandbox Code Playgroud)
我想提取value每个得分colX最高的 并找到与前一个文件中的哪个 profile_id 相关联。
我所做的正在发挥作用:
profiles = pd.read_csv("profiles.csv", sep="\t", index_col=False)
df = pd.read_csv("results.csv", sep="\t", index_col=False)
found_col = set(df["col"])
good_profile = profiles.copy()
for col in …Run Code Online (Sandbox Code Playgroud)