我有一系列633个值,其中约50%为0.理想情况下,我想使用我的值(用于等值线映射目的)qcut(),但由于非唯一的bin边缘,这会给我一个错误.分离数据的最佳方法是什么,对非零值进行分类,然后将它们重新组合成一列,使得零值的值为0,而量化值具有categorical.label + 1?
如果用零替换零值NaN,cut()并按qcut()预期运行; 这些行将具有bin值(from Categorical.labels)-1:
df['density'].replace(to_replace=0, value=np.nan, inplace=True)
Run Code Online (Sandbox Code Playgroud)