use*_*984 3 python nan dataframe pandas
我有一个非常大的 Pandas DataFrame,如下所示:
>>> d = pd.DataFrame({"a": ["1", "U", "3.4"]})
>>> d
a
0 1
1 U
2 3.4
Run Code Online (Sandbox Code Playgroud)
目前该列设置为object:
>>> d.dtypes
a object
dtype: object
Run Code Online (Sandbox Code Playgroud)
我想将此列转换为浮动,以便我可以使用groupby()和计算平均值。当我尝试使用它时,astype我正确地收到错误,因为字符串无法转换为浮动:
>>> d.a.astype(float)
ValueError: could not convert string to float: 'U'
Run Code Online (Sandbox Code Playgroud)
我想做的是将所有元素投射到浮动,然后替换那些不能被 NaN 投射的元素。
我怎样才能做到这一点?
我尝试设置raise_on_error,但它不起作用,dtype仍然是object.
>>> d.a.astype(float, raise_on_error=False)
0 1
1 U
2 3.4
Name: a, dtype: object
Run Code Online (Sandbox Code Playgroud)
使用to_numeric并指定errors='coerce'强制无法解析为数值的字符串变为NaN:
>>> pd.to_numeric(d['a'], errors='coerce')
0 1.0
1 NaN
2 3.4
Name: a, dtype: float64
Run Code Online (Sandbox Code Playgroud)