我有类似下面的'DataFrame`:
>>> df=pd.DataFrame(index=['A','A','A','B','B','C','C','C'])
>>> df['Value1']=[1,1,1,2,1,4,4,4]
>>> df['Value2']=[1,2,3,4,5,6,7,8]
>>> df
Value1 Value2
A 1 1
A 1 2
A 1 3
B 2 4
B 1 5
C 4 6
C 4 7
C 4 8
>>>
Run Code Online (Sandbox Code Playgroud)
该索引DataFrame代表3个不同的组.我想检查组中的列值是否都相等.我目前的方法和所需的输出如下:
>>> result_list=[]
>>> for Col in df.columns:
... result=df.groupby(level=0)[Col].apply(lambda x: len(set(x))==1)
... result_list.append(result)
...
>>>
>>> final=pd.concat(result_list,1)
>>> final
Value1 Value2
A True False
B False False
C True False
>>>
Run Code Online (Sandbox Code Playgroud)
这是最好的方法吗?我想知道是否可以这样做而不必循环遍历我的列DataFrame.
另外是使用len(set(x)==1)最好的方法来确定组中的所有项目是否相等?
df.groupby(level=0).agg(lambda x: len(set(x)) == 1)
Value1 Value2
A True False
B False False
C True False
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
3960 次 |
| 最近记录: |