我在以下代码中遇到错误。无法理解为什么。在代码的最后一行出现错误。请告知必须采取什么措施来纠正它。除此之外 df.isna().any() 也不起作用。
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
data = pd.read_csv('BlackFriday.csv')
df = pd.DataFrame(data)
df.info()
df.describe()
df.head()
#To check the unique values of Product Categories 2, 3 and then assign a default value accordingly for NaN's
Product_Category_2 = df['Product_Category_2'].unique()
Product_Category_3 = df['Product_Category_3'].unique()
print('Product_Category_2', Product_Category_2)
print('Product_Category_3', Product_Category_3)
df = df.fillna(0, inplace=True)
---------------------------------------------------------------------------
AttributeError Traceback (most recent call last)
<ipython-input-16-7f28e582ea84> in <module>()
1 #We can replace the NaN's with 0.
----> 2 df = df.fillna(0, inplace=True)
3
AttributeError: 'NoneType' object has no attribute 'fillna'
Run Code Online (Sandbox Code Playgroud)
我看到的第一个问题,pd.read_csv已经创建了一个数据框,所以你不需要再次将它分配给一个数据框。
然后,您的主要问题是:您不能在同一个赋值操作中同时使用inplace=True和df=df.fillna()。inplace=True导致fillna方法返回None,然后您将其分配给 df。这有效,并将您的变量分配给None,但不应导致您看到的错误,除非您尝试重新运行该行代码或在运行后引用数据帧。
df=pd.DataFrame({'a':[1,2,3,4,5],'b':[6,7,8,9,0],'c':[None,None,1,2,None]})
a b c
0 1 6 NaN
1 2 7 NaN
2 3 8 1.0
3 4 9 2.0
4 5 0 NaN
Run Code Online (Sandbox Code Playgroud)
正确的:
任何一个
df.fillna(0,inplace=True)
Run Code Online (Sandbox Code Playgroud)
或者
df=df.fillna(0)
df
a b c
0 1 6 0.0
1 2 7 0.0
2 3 8 1.0
3 4 9 2.0
4 5 0 0.0
Run Code Online (Sandbox Code Playgroud)
不正确:
df=df.fillna(0, inplace=True)
print(df)
None
Run Code Online (Sandbox Code Playgroud)