我有一些看起来像这样的数据:
c stuff
c more header
c begin data
1 1:.5
1 2:6.5
1 3:5.3
Run Code Online (Sandbox Code Playgroud)
我想将它导入3列数据框,例如列
a , b, c
1, 1, 0.5
etc
Run Code Online (Sandbox Code Playgroud)
我一直试图读取数据,因为2列分为':',然后将第一列拆分为''.但是我发现它令人厌烦.是否有更好的方法直接对其进行排序?
目前:
data1 = pd.read_csv(file_loc, skiprows = 3, delimiter = ':', names = ['AB', 'C'])
data2 = pd.DataFrame(data1.AB.str.split(' ',1).tolist(), names = ['A','B'])
Run Code Online (Sandbox Code Playgroud)
然而,由于我的数据具有领先的空间,这使事情变得更加复杂......
我觉得这应该是一个简单的任务,但是目前我正在考虑逐行阅读并使用一些find replace来在导入之前清理数据.
看来pandas read_csv函数只允许使用单字符分隔符/分隔符.有没有办法允许使用一串字符,比如"*|*"或"%%"?