我最近开始使用 Pandas,目前我正在尝试估算数据集中的一些缺失值。
我想根据中位数(对于数字条目)和模式(对于分类条目)来估算缺失值。但是,我不想计算整个数据集的中位数和众数,而是基于GroupBy名为"make".
对于数值,我做了以下工作:
data = data.fillna(data.groupby("make").transform("median"))
Run Code Online (Sandbox Code Playgroud)
--> 这完美地工作,并用NA它们的中位数替换了我所有的数值"make"。
但是,我无法为模式做同样的事情,即将所有分类 NA 值替换为它们的"make".
有谁知道怎么做?