J J*_*nes 14 python dataframe pandas
我有一个混合数据类型的pandas DataFrame.我想用None替换所有空值(而不是默认的np.nan).出于某种原因,这似乎几乎是不可能的.
实际上我的数据框是从csv读入的,但这里有一个简单的DataFrame,它有混合数据类型来说明我的问题.
df = pd.DataFrame(index=[0], columns=range(5))
df.iloc[0] = [1, 'two', np.nan, 3, 4] 
Run Code Online (Sandbox Code Playgroud)
我做不到:
>>> df.fillna(None)
ValueError: must specify a fill method or value
Run Code Online (Sandbox Code Playgroud)
也不:
>>> df[df.isnull()] = None
TypeError: Cannot do inplace boolean setting on mixed-types with a non np.nan value
Run Code Online (Sandbox Code Playgroud)
也不:
>>> df.replace(np.nan, None)
TypeError: cannot replace [nan] with method pad on a DataFrame
Run Code Online (Sandbox Code Playgroud)
我曾经有一个只有字符串值的DataFrame,所以我可以这样做:
>>> df[df == ""] = None
Run Code Online (Sandbox Code Playgroud)
哪个有效.但是现在我有混合数据类型,这是不行的.
由于我的代码的各种原因,能够使用None作为我的空值将是有帮助的.有没有办法可以将空值设置为None?或者我只需要返回我的其他代码并确保我在所有地方都使用np.isnan或pd.isnull?
piR*_*red 27
pd.DataFrame.where条件满足时使用
 
使用df值,否则使用None
df.where(df.notnull(), None)
Run Code Online (Sandbox Code Playgroud)
        扩展接受的答案。当您还需要捕获NaN数字 dtype 列中的值时,您可能需要object首先将 dtype 更改为:
df.astype(object).where(df.notna(), None)
Run Code Online (Sandbox Code Playgroud)
根据@BENNY 的原始回复