所以我正在读取 CSV 文件,然后只保留某些列并重写该文件。我遇到的问题是一列(例如 ColumnA)的值用双引号引起来。有没有一种简单的方法可以让我完成这项任务并删除那些双引号?
a = pd.read_csv(filename,low_memory=False)
a1 = a[['ColumnA','ColumnB']]
a1.to_csv('filelocation')
Run Code Online (Sandbox Code Playgroud)
您可以使用以下命令抑制引用csv.QUOTE_NONE:
import csv
pd.read_csv(filename,usecols=['ColumnA','ColumnB']) \
.to_csv(new_file_name, quoting=csv.QUOTE_NONE, index=False)
Run Code Online (Sandbox Code Playgroud)
但最好(更安全)选择另一个分隔符(列中没有出现的分隔符ColumnA),这样将来当您读取/解析新的 CSV 文件时就不会遇到问题:
pd.read_csv(filename,usecols=['ColumnA','ColumnB']) \
.to_csv(new_file_name, sep=';', index=False)
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
19150 次 |
| 最近记录: |