Python Dataframe - 在加载 from_csv 时将数据保留为字符串

Pan*_*ngh 2 python dataframe import-from-csv pandas

from_csv 选择“04”作为值之一并将其转换为字符串。如何确保所有被拾取的列都是字符串?我希望避免处理单个列,因为有 114 列,并且我不想在列受到影响时进行分析。

EdC*_*ica 6

如果您想要所有列,str则传递dtype=strread_csv

df = pd.read_csv(file_path, dtype=str)
Run Code Online (Sandbox Code Playgroud)

将保留任何前导零

例子:

In [54]:
t="""a,b
001,230
01,003"""
df = pd.read_csv(io.StringIO(t), dtype=str)
df

Out[54]:
     a    b
0  001  230
1   01  003
Run Code Online (Sandbox Code Playgroud)

这里的数据类型将被列为object此处正确的数据类型str

In [55]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 2 entries, 0 to 1
Data columns (total 2 columns):
a    2 non-null object
b    2 non-null object
dtypes: object(2)
memory usage: 112.0+ bytes
Run Code Online (Sandbox Code Playgroud)