用pandas读取rpt文件

edy*_*y13 2 python pandas

我使用以下方法将 rpt 数据读取到熊猫:

import pandas as pd
df = pd.read_fwf("2014-1.rpt", skiprows=[1], nrows=150)
Run Code Online (Sandbox Code Playgroud)

我实际上按照这里的 anwser 但是,对于某些列,分隔不准确。这是我得到的样本:

Country   Order Date Device   Category
UK        2014-01-03 Desktop  Shoes
IT        2014-01-03 Desktop  Shoes
FR        2014-01-04 Desktop  Dress
FR        2014-01-04 Tablet   Dress
US        2014-01-05 Desktop  Bags
US        2014-01-06 Desktop  Bags
UK        2014-01-07 Tablet   Dress
Run Code Online (Sandbox Code Playgroud)

例如,它将 Order Date 和 Device 列读取为单个列。其实这只是一个例子,有很多这样的专栏。如何解决?你有什么主意吗?实际上这些有问题的列可能有固定的宽度

GK8*_*K89 5

这个问题很老了,但这里有一个答案。您可以使用 Pandas 将其作为 csv 读取。我已经将它用于各种 rpt 文件并且它已经奏效了。

import pandas as pd
df = pd.read_csv("2014-1.rpt", skiprows=[1], nrows=150)
Run Code Online (Sandbox Code Playgroud)