如果我的问题已经回答,请接受我的道歉。我试图找到一个解决方案,但我能找到的就是为数据帧中所有NaN的dropna解决方案。我的问题是我有一个6列500行的数据框。我需要检查是否在任何特定行中所有值都是NaN,以便可以从数据集中删除它们。第2、6和7行下面的示例包含从col1到col6的所有Nan:
Col1 Col2 Col3 Col4 Col5 Col6
12 25 02 78 88 90
Nan Nan Nan Nan Nan Nan
Nan 35 03 11 65 53
Nan Nan Nan Nan 22 21
Nan 15 93 111 165 153
Nan Nan Nan Nan Nan Nan
Nan Nan Nan Nan Nan Nan
141 121 Nan Nan Nan Nan
Run Code Online (Sandbox Code Playgroud)
请注意,第一行只是标题,从第二行开始,我的数据就会开始。如果有人能以正确的方向帮助我解决这个难题,将不胜感激。
我的第二个问题是,在删除所有列中的所有Nan之后,如果要删除缺少4或5列数据的行,那么什么是最佳解决方案?
最后一个问题是,在删除具有最多Nan的行之后,是否可以,然后如何在其余的行(例如450行)上创建箱形图?
任何回应将不胜感激。
问候,
我有一个数据框,我在其中对 3 列进行 groupby 并汇总数字列的总和和大小。运行代码后
df = pd.DataFrame.groupby(['year','cntry', 'state']).agg(['size','sum'])
Run Code Online (Sandbox Code Playgroud)
我得到如下内容:
现在我想从主列中拆分我的大小子列并仅创建单个大小的列,但希望将总和列保留在主列标题下。我尝试了不同的方法但没有成功。这些是我尝试过但无法让事情为我工作的方法:
将 Pandas GroupBy 对象转换为 DataFrame
如果有人可以帮助我解决这个问题,将不胜感激。
问候,