我使用以下方法将 rpt 数据读取到熊猫:
import pandas as pd
df = pd.read_fwf("2014-1.rpt", skiprows=[1], nrows=150)
Run Code Online (Sandbox Code Playgroud)
我实际上按照这里的 anwser 但是,对于某些列,分隔不准确。这是我得到的样本:
Country Order Date Device Category
UK 2014-01-03 Desktop Shoes
IT 2014-01-03 Desktop Shoes
FR 2014-01-04 Desktop Dress
FR 2014-01-04 Tablet Dress
US 2014-01-05 Desktop Bags
US 2014-01-06 Desktop Bags
UK 2014-01-07 Tablet Dress
Run Code Online (Sandbox Code Playgroud)
例如,它将 Order Date 和 Device 列读取为单个列。其实这只是一个例子,有很多这样的专栏。如何解决?你有什么主意吗?实际上这些有问题的列可能有固定的宽度
这个问题很老了,但这里有一个答案。您可以使用 Pandas 将其作为 csv 读取。我已经将它用于各种 rpt 文件并且它已经奏效了。
import pandas as pd
df = pd.read_csv("2014-1.rpt", skiprows=[1], nrows=150)
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
8214 次 |
| 最近记录: |