如何将由空格分隔的文本文件读入DataFrame？

Question

如何将由空格分隔的文本文件读入DataFrame？

我有一个以这种方式格式化的文本文件:

A00     0010  00000
A001    0011  00000
A00911  0019  00000
A0100   0020  10000

Run Code Online (Sandbox Code Playgroud)

我想将此文件读入DataFrame.所以我尝试过:

import pandas as pd
path = *file path*
df = pd.read_csv(path, sep = '\t', header = None)

Run Code Online (Sandbox Code Playgroud)

我得到的是一个包含4行和1列的DataFrame.

                         0
0      A00     0010  00000
1      A001    0011  00000
2      A00911  0019  00000
3      A0100   0020  10000

[4 rows x 1 columns]

Run Code Online (Sandbox Code Playgroud)

这是因为值不是由"\ t"分隔的.列之间的空格数在每行中有所不同,具体取决于字符串的长度.

所需的DataFrame应该有四行三列.

          0       1      2  
0      A000    0010  00000
1      A001    0011  00000
2      A009    0019  00000
3      A0100   0020  10000

[4 rows x 3 columns]

Run Code Online (Sandbox Code Playgroud)

Answer 1

Nic*_*eli 5

你可以提供delim_whitespace=True与一起dtype=str保存在dtypes ARGS read_csv,如:

df = pd.read_csv(path, delim_whitespace=True, header=None, dtype=str)
df

Run Code Online (Sandbox Code Playgroud)

归档时间：	9 年，1 月前
查看次数：	111 次
最近记录：	9 年，1 月前