我用这个命令导入了一个 .csv 文件:
mydata = pd.read_csv(file ,sep='\t' , engine='python' , dtype = {'Day' : np.datetime64 , 'Year' : np.int} )
Run Code Online (Sandbox Code Playgroud)
但我注意到一些列名有空格,Account id
而不是Account_id
现在我得到了我的列名列表:
dwb_col= data.columns
Run Code Online (Sandbox Code Playgroud)
我想blank spaces " "
用"_"
符号替换每个列名(即每个 dwb_col 元素)。
为了以这种方式重命名列:mydata.columns = [my_new_columns_list]
我怎样才能找到和更换零件?
在导入过程中是否有任何解决方法/快捷方式让我在“”(空格)上收集带有“_”(下划线符号)的列名称?
你好,我有 4 个 pandas 数据框:df1、df2、df3、df4。我喜欢做的是使用 迭代(使用 for 循环)此数据帧的保存to_pickle
。我所做的是这样的:
out = 'mypath\\myfolder\\'
r = [ orders, adobe, mails , sells]
for i in r:
i.to_pickle( out + '\\i.pkl')
Run Code Online (Sandbox Code Playgroud)
该命令很好,但它不会用他的名字保存每个数据库,而是覆盖相同的数据库i.pkl
(我认为因为我的代码不正确)似乎它不能用他的名字重命名每个数据库(例如,对于 for 循环订单内的订单与涉及的订单数据帧一起保存名称i.pkl
等)我期望的是保存4个数据帧,并在对象r中插入插入的名称(例如:orders.pkl,adobe.pkl,mails.pkl,sells.pkl)
我怎样才能做到这一点?