我有一个DataFrame包含数字作为字符串与数千标记的逗号.我需要将它们转换为浮点数.
a = [['1,200', '4,200'], ['7,000', '-0.03'], [ '5', '0']]
df=pandas.DataFrame(a)
Run Code Online (Sandbox Code Playgroud)
我猜我需要使用locale.atof.确实
df[0].apply(locale.atof)
Run Code Online (Sandbox Code Playgroud)
按预期工作.我得到了一系列花车.
但是当我将它应用于DataFrame时,我收到一个错误.
df.apply(locale.atof)
Run Code Online (Sandbox Code Playgroud)
TypeError :("无法将系列转换为",在索引0处发生')
和
df[0:1].apply(locale.atof)
Run Code Online (Sandbox Code Playgroud)
给出另一个错误:
ValueError :('float()的无效文字:1,200',u'occurred在索引0')
那么,我如何将这个DataFrame字符串转换为浮动的DataFrame?
And*_*den 102
df.read_csv('foo.tsv', sep='\t', thousands=',')
Run Code Online (Sandbox Code Playgroud)
该方法可能比作为单独步骤执行操作更有效.
您需要先设置区域设置:
In [ 9]: import locale
In [10]: from locale import atof
In [11]: locale.setlocale(locale.LC_NUMERIC, '')
Out[11]: 'en_GB.UTF-8'
In [12]: df.applymap(atof)
Out[12]:
0 1
0 1200 4200.00
1 7000 -0.03
2 5 0.00
Run Code Online (Sandbox Code Playgroud)
小智 31
您可以像这样一次转换一列:
df['colname'] = df['colname'].str.replace(',', '').astype(float)
Run Code Online (Sandbox Code Playgroud)
she*_* ke 20
您可以使用pandas.Series.str.replace方法:
df.iloc[:,:].str.replace(',', '').astype(float)
Run Code Online (Sandbox Code Playgroud)
此方法可以删除或替换字符串中的逗号.
| 归档时间: |
|
| 查看次数: |
54236 次 |
| 最近记录: |