我正在使用pandas来读取休息服务中的文件.该文件非常庞大,有超过100列.但我只想阅读前两列.我知道我可以在read_csv中使用usecols,但我想知道它究竟是如何工作的?
pandas是否读取整个文件并过滤掉所需的列?或者它只读取所需的列?
我问,因为我不想重写内存.
根据该文件,它会读取整个文件(没办法只能从磁盘中读取列),但只会解析和存储在给定的列use_cols变量(强调我的):
usecols:list-like或callable,optional
返回列的子集... 使用此参数可以更快地解析分析时间并降低内存使用量.
| 归档时间: |
|
| 查看次数: |
47 次 |
| 最近记录: |