我在这里面临一些问题,在我的python包中我安装了numpy,但我仍然有这个错误'DataFrame'对象没有属性'sort'
任何人都可以给我一些想法..
这是我的代码:
final.loc[-1] =['', 'P','Actual']
final.index = final.index + 1 # shifting index
final = final.sort()
final.columns=[final.columns,final.iloc[0]]
final = final.iloc[1:].reset_index(drop=True)
final.columns.names = (None, None)
Run Code Online (Sandbox Code Playgroud) 我有一个包含两列的数据框:“代理”和“客户端”每一行对应于代理和客户端之间的交互。
如果客户与至少 2 个代理进行了交互,我只想保留行。
我怎样才能做到这一点?
我有一个数据框,其中重复了一些 SongId。我想提取那些有重复的行。知道怎么做吗?尝试:
dfB[dfB.SongId.duplicated()]
Run Code Online (Sandbox Code Playgroud)
但效果并不好。
这是我的数据框的一个例子。SongId 0、10 和 16 在此示例中重复:
当我使用时,我有一个大约 52000 行的数据框,其中有一些重复
df_drop_duplicates()
Run Code Online (Sandbox Code Playgroud)
我丢失了大约 1000 行,但我不想删除这些行我想知道哪些是重复行