我发现了两种根据条件替换数据框某些值的形式:
mask = df['param'].isnull()
df.loc[mask, 'param'] = 'new_value'
Run Code Online (Sandbox Code Playgroud)
mask = df['param'].isnull()
df['param'] = np.where(mask, 'new_value', df['param'])
Run Code Online (Sandbox Code Playgroud)
两种形式都很好用,但哪一种是首选呢?关于这个问题,我什么时候应该使用.loc,什么时候应该使用np.where?
我有一个包含长文本描述的列的数据框。
我想显示所有文本而不截断它,但是以列变宽而不是使行变高的方式显示。
如果我让熊猫的默认设置,我得到下一个:
但是,如果我尝试使用 删除 truncate pd.set_option('display.max_colwidth', -1)
,则行会变高,而行宽几乎相等: