如何将pandas数据框的数据类型更改为具有已定义格式的字符串?

use*_*097 22 python string format floating-point pandas

我开始用这个撕掉我的头发 - 所以我希望有人可以帮忙.我有一个使用openpyxl从Excel电子表格创建的pandas DataFrame.生成的DataFrame看起来像:

print image_name_data
     id           image_name
0  1001  1001_mar2014_report
1  1002  1002_mar2014_report
2  1003  1003_mar2014_report

[3 rows x 2 columns]
Run Code Online (Sandbox Code Playgroud)

...具有以下数据类型:

print image_name_data.dtypes
id            float64
image_name     object
dtype: object
Run Code Online (Sandbox Code Playgroud)

问题是id列中的数字实际上是标识号,我需要将它们视为字符串.我尝试使用以下命令将id列转换为字符串:

image_name_data['id'] = image_name_data['id'].astype('str')
Run Code Online (Sandbox Code Playgroud)

这看起来有点难看但它确实产生了'object'类型的变量而不是'float64':

print image_name_data.dyptes
id            object
image_name    object
dtype: object
Run Code Online (Sandbox Code Playgroud)

但是,创建的字符串具有小数点,如下所示:

print image_name_data
       id           image_name
0  1001.0  1001_mar2014_report
1  1002.0  1002_mar2014_report
2  1003.0  1003_mar2014_report

[3 rows x 2 columns]
Run Code Online (Sandbox Code Playgroud)

如何将pandas DataFrame中的float64列转换为具有给定格式的字符串(在本例中为'%10.0f')?

exp*_*rer 54

我无法重现您的问题,但您是否尝试过将其转换为整数?

image_name_data['id'] = image_name_data['id'].astype(int).astype('str')
Run Code Online (Sandbox Code Playgroud)

然后,关于您可以使用的更一般的问题map(如在此答案中).在你的情况下:

image_name_data['id'] = image_name_data['id'].map('{:.0f}'.format)
Run Code Online (Sandbox Code Playgroud)

  • 如果存在任何NaN / null值,则首先转换为int会失败(错误消息为“ *** ValueError:无法将NA转换为整数”)。我有int或丢失的数据,但是astype('str')高兴地向每个数字添加了'.0'...不知道如何防止这种情况。 (2认同)

smi*_*hra 6

如果你可以重新加载它,你可能可以使用dtypes参数.

pd.read_csv(..., dtype={'COL_NAME':'str'})
Run Code Online (Sandbox Code Playgroud)