Rak*_*van 1 python dataframe pandas
我有一个以这种方式格式化的文本文件:
A00 0010 00000
A001 0011 00000
A00911 0019 00000
A0100 0020 10000
Run Code Online (Sandbox Code Playgroud)
我想将此文件读入DataFrame.所以我尝试过:
import pandas as pd
path = *file path*
df = pd.read_csv(path, sep = '\t', header = None)
Run Code Online (Sandbox Code Playgroud)
我得到的是一个包含4行和1列的DataFrame.
0
0 A00 0010 00000
1 A001 0011 00000
2 A00911 0019 00000
3 A0100 0020 10000
[4 rows x 1 columns]
Run Code Online (Sandbox Code Playgroud)
这是因为值不是由"\ t"分隔的.列之间的空格数在每行中有所不同,具体取决于字符串的长度.
所需的DataFrame应该有四行三列.
0 1 2
0 A000 0010 00000
1 A001 0011 00000
2 A009 0019 00000
3 A0100 0020 10000
[4 rows x 3 columns]
Run Code Online (Sandbox Code Playgroud)
你可以提供delim_whitespace=True与一起dtype=str保存在dtypes ARGS read_csv,如:
df = pd.read_csv(path, delim_whitespace=True, header=None, dtype=str)
df
Run Code Online (Sandbox Code Playgroud)