小编Plo*_*opp的帖子

熊猫找到轮廓最接近的行

我有一个充满配置文件的文件,如下所示:

 profile_id  colA  colB  colC  colD
 1           1     20    50    63
 2           1     20    65    38
 3           8     5     3     4
 4           98    1     878   4
 ...
Run Code Online (Sandbox Code Playgroud)

我有另一个 CSV 文件,其中包含我想要查找个人资料的结果:

col    value    score
colA   1        85
colA   1        856
colA   8        200000
colB   1        2356
colC   878      99999
colD   4        2
...
Run Code Online (Sandbox Code Playgroud)

我想提取value每个得分colX最高的 并找到与前一个文件中的哪个 profile_id 相关联。

我所做的正在发挥作用:

profiles = pd.read_csv("profiles.csv", sep="\t", index_col=False)
df = pd.read_csv("results.csv", sep="\t", index_col=False)

found_col = set(df["col"])
good_profile = profiles.copy()
for col in …
Run Code Online (Sandbox Code Playgroud)

python pandas

5
推荐指数
1
解决办法
98
查看次数

标签 统计

pandas ×1

python ×1