Bra*_*hen 3 python nan missing-data dataframe pandas
我有一个像这样的数据框 df
df = pd.DataFrame([
{'Name': 'Chris', 'Item Purchased': 'Sponge', 'Cost': 22.50},
{'Name': 'Kevyn', 'Item Purchased': 'Kitty Litter', 'Cost': '.........'},
{'Name': 'Filip', 'Item Purchased': 'Spoon', 'Cost': '...'}],
index=['Store 1', 'Store 1', 'Store 2'])
Run Code Online (Sandbox Code Playgroud)
我想将“成本”列中的缺失值替换为np.nan. 到目前为止,我已经尝试过:
df['Cost']=df['Cost'].str.replace("\.\.+", np.nan)
Run Code Online (Sandbox Code Playgroud)
和
df['Cost']=re.sub('\.\.+',np.nan,df['Cost'])
Run Code Online (Sandbox Code Playgroud)
但它们似乎都不能正常工作。请帮忙。
DataFrame.replace配合regex=True开关使用。
df = df.replace('\.+', np.nan, regex=True)
df
Cost Item Purchased Name
Store 1 22.5 Sponge Chris
Store 1 NaN Kitty Litter Kevyn
Store 2 NaN Spoon Filip
Run Code Online (Sandbox Code Playgroud)
图案\.+指定一个或多个点。您也可以将其[.]+用作模式以达到相同的效果。