正确访问存在重复索引值的切片

Question

正确访问存在重复索引值的切片

我有一个带有索引的数据框，有时包含具有相同索引值的行。现在我想对该数据帧进行切片并根据行索引设置值。

考虑以下示例：

import pandas as pd

df = pd.DataFrame({'index':[1,2,2,3], 'values':[10,20,30,40]})
df.set_index(['index'], inplace=True)

df1 = df.copy()
df2 = df.copy()

#copy warning
df1.iloc[0:2]['values'] = 99
print(df1)

df2.loc[df.index[0:2], 'values'] = 99
print(df2)

Run Code Online (Sandbox Code Playgroud)

df1 是预期结果，但给了我一个SettingWithCopyWarning。df2 似乎是文档建议的访问方式，但给了我错误的结果（因为重复索引）

是否有一种“正确”的方法可以在存在重复索引值的情况下正确设置这些值？

Answer 1

jez*_*ael 5

.loc当您有重复索引时不建议使用。所以你必须进行基于职位的选择iloc。由于我们需要传递位置，因此我们必须用于get_loc获取列的位置：

print (df2.columns.get_loc('values'))
0

df1.iloc[0:2, df2.columns.get_loc('values')] = 99
print(df1)
       values
index        
1          99
2          99
2          30
3          40

Run Code Online (Sandbox Code Playgroud)

归档时间：	8 年，2 月前
查看次数：	2156 次
最近记录：	8 年，2 月前