我正在解析Excel文件中的数据,该文件在某些列标题中有额外的空白区域.
当我检查结果数据帧的列时,如下所示:
df.columns
结果如下:
Index(['Year', 'Month ', 'Value'])
因此,我无法逃避
df["Month"]
因为它会告诉我找不到列,因为我要求"月",而不是"月".
那么,我的问题是如何从列标题中删除不需要的空白区域?
在python/pandas中清理multitype数据框的值,我想修剪字符串.我目前正在两个指令中执行此操作:
import pandas as pd
df = pd.DataFrame([[' a ', 10], [' c ', 5]])
df.replace('^\s+', '', regex=True, inplace=True) #front
df.replace('\s+$', '', regex=True, inplace=True) #end
df.values
Run Code Online (Sandbox Code Playgroud)
这很慢,我能改进什么?
我遵循以下过程:在Python中,如何将列表中的所有项目转换为浮点数?因为我的Dataframe的每一列都是list
,但floats
我没有选择将所有值更改为strings
.
df = [str(i) for i in df]
但这失败了.
它只删除了除第一行列名之外的所有数据.
然后,尝试df = [str(i) for i in df.values]
导致将整个Dataframe更改为一个大的列表,但这会使数据过于混乱,无法满足我的脚本目标,即将Dataframe导出到我的Oracle表.
有没有办法将我的Dataframe中非字符串的所有项目转换为字符串?