我想将字符串数据转换为int以删除小数点作为Integer。它在数据帧中具有浮点格式的数据。
如果该列没有nan数据,则可以使用。但是,如果nan数据类似于以下代码,则它将不起作用。
df = pd.Dataframe([[1, '1.0'], [2, ''], [3, '2.8']],
columns=['id', 'number'])
df.loc[:, 'number'] = df['number'].astype(float).astype(int)
Run Code Online (Sandbox Code Playgroud)
我该怎么做?
首次to_numeric用于将非数字转换为NaNs。
如果可以使用熊猫0.24+,请使用Nullable整数数据类型:
#get values before `.`
s = df['number'].str.split('\.').str[0]
df['number'] = pd.to_numeric(s, errors='coerce').astype('Int64')
Run Code Online (Sandbox Code Playgroud)
或使用np.floor:
df['number'] = pd.to_numeric(df['number'], errors='coerce').apply(np.floor).astype('Int64')
Run Code Online (Sandbox Code Playgroud)
要么:
df['number'] = np.floor(pd.to_numeric(df['number'], errors='coerce'))
df['number'] = df['number'].astype('Int64')
Run Code Online (Sandbox Code Playgroud)