将字符串转换为DataFrame中的浮点数

Nee*_*eer 103 python pandas

如何将包含字符串和NaN值的DataFrame列转换为浮点数.还有另一列,其值为字符串和浮点数; 如何将整个列转换为浮点数.

Jef*_*eff 70

注意: pd.convert_objects现已弃用.您应该使用pd.Series.astype(float)pd.to_numeric如其他答案中所述.

这是0.11.强制转换(或设置为nan)即使astype失败也会起作用; 它也是系列的系列所以它不会转换说完整的字符串列

In [10]: df = DataFrame(dict(A = Series(['1.0','1']), B = Series(['1.0','foo'])))

In [11]: df
Out[11]: 
     A    B
0  1.0  1.0
1    1  foo

In [12]: df.dtypes
Out[12]: 
A    object
B    object
dtype: object

In [13]: df.convert_objects(convert_numeric=True)
Out[13]: 
   A   B
0  1   1
1  1 NaN

In [14]: df.convert_objects(convert_numeric=True).dtypes
Out[14]: 
A    float64
B    float64
dtype: object
Run Code Online (Sandbox Code Playgroud)

  • 现在是较新版本的pd.to_numeric(col) (17认同)
  • `df ['ColumnName'] = df ['ColumnName'].convert_objects(convert_numeric = True)`您只能转换一列. (16认同)
  • convert_objects在较新的pandas中已弃用.使用特定于数据类型的转换器pd.to_numeric. (11认同)

roo*_*oot 48

你可以试试df.column_name = df.column_name.astype(float).至于NaN值,您需要指定它们的转换方式,但您可以使用该.fillna方法来执行此操作.

例:

In [12]: df
Out[12]: 
     a    b
0  0.1  0.2
1  NaN  0.3
2  0.4  0.5

In [13]: df.a.values
Out[13]: array(['0.1', nan, '0.4'], dtype=object)

In [14]: df.a = df.a.astype(float).fillna(0.0)

In [15]: df
Out[15]: 
     a    b
0  0.1  0.2
1  0.0  0.3
2  0.4  0.5

In [16]: df.a.values
Out[16]: array([ 0.1,  0. ,  0.4])
Run Code Online (Sandbox Code Playgroud)


Sal*_*ali 44

在较新版本的pandas(0.17及更高版本)中,您可以使用to_numeric函数.它允许您转换整个数据框或仅转换单个列.它还使您能够选择如何处理无法转换为数值的内容:

import pandas as pd
s = pd.Series(['1.0', '2', -3])
pd.to_numeric(s)
s = pd.Series(['apple', '1.0', '2', -3])
pd.to_numeric(s, errors='ignore')
pd.to_numeric(s, errors='coerce')
Run Code Online (Sandbox Code Playgroud)

  • 要将`pd.to_numeric`应用于`DataFrame`,可以使用`df.apply(pd.to_numeric)`作为[在此答案中详细解释](/sf/answers/2439140721/) . (31认同)

Cla*_*MBE 28

df['MyColumnName'] = df['MyColumnName'].astype('float64') 
Run Code Online (Sandbox Code Playgroud)

  • 当从String转换为Float时,这不起作用:`ValueError:无法将字符串转换为float:'date' (4认同)

小智 8

您必须先将np.nan替换为空字符串(''),然后再转换为float。即:

df['a']=df.a.replace('',np.nan).astype(float)
Run Code Online (Sandbox Code Playgroud)