python pandas删除系列中的重复项

mat*_*ick 6 python pandas

是否有一个函数来强制索引是唯一的,或者它只能通过转换为dict和back或类似的东西在python'本身'中处理它?

如下面的评论中所述:python pandas是一个基于numpy/scipy构建的项目.

to_dict和返回工作,但我敢打赌,当你获得大奖时,这会变慢.

In [24]: a = pandas.Series([1,2,3], index=[1,1,2])

In [25]: a
Out[25]: 
1    1
1    2
2    3

In [26]: a = a.to_dict()

In [27]: a
Out[27]: {1: 2, 2: 3}

In [28]: a = pandas.Series(a)

In [29]: a
Out[29]: 
1    2
2    3
Run Code Online (Sandbox Code Playgroud)

Wes*_*ney 6

顺便说一下,我们计划在不久的将来drop_duplicates为系列添加方法DataFrame.drop_duplicates.


roo*_*oot 4

使用groupbylast()

In [279]: s
Out[279]: 
a    1
b    2
b    3
b    4
e    5

In [280]: grouped = s.groupby(level=0)

In [281]: grouped.first()
Out[281]: 
a    1
b    2
e    5

In [282]: grouped.last()
Out[282]: 
a    1
b    4
e    5
Run Code Online (Sandbox Code Playgroud)