相关疑难解决方法(0)

如何使用带有gzip压缩选项的pandas read_csv读取tar.gz文件?

我有一个非常简单的csv,其中包含以下数据,在tar.gz文件中压缩.我需要使用pandas.read_csv在数据框中读取它.

   A  B
0  1  4
1  2  5
2  3  6

import pandas as pd
pd.read_csv("sample.tar.gz",compression='gzip')
Run Code Online (Sandbox Code Playgroud)

但是,我收到错误:

CParserError: Error tokenizing data. C error: Expected 1 fields in line 440, saw 2
Run Code Online (Sandbox Code Playgroud)

以下是read_csv命令的集合以及我得到的不同错误:

pd.read_csv("sample.tar.gz",compression='gzip',  engine='python')
Error: line contains NULL byte

pd.read_csv("sample.tar.gz",compression='gzip', header=0)
CParserError: Error tokenizing data. C error: Expected 1 fields in line 440, saw 2

pd.read_csv("sample.tar.gz",compression='gzip', header=0, sep=" ")
CParserError: Error tokenizing data. C error: Expected 2 fields in line 94, saw 14    

pd.read_csv("sample.tar.gz",compression='gzip', header=0, sep=" ", engine='python')
Error: …
Run Code Online (Sandbox Code Playgroud)

python csv gzip tar pandas

12
推荐指数
2
解决办法
2万
查看次数

将tar.gz转换为zip

我的Ubuntu网络服务器上有大量的gzip压缩文件,我需要将它们转换成拉链.我想这可以用脚本完成,但我应该使用什么语言,以及如何解压缩和重新压缩文件?

linux ubuntu zip gzip

6
推荐指数
2
解决办法
2万
查看次数

标签 统计

gzip ×2

csv ×1

linux ×1

pandas ×1

python ×1

tar ×1

ubuntu ×1

zip ×1