我有一个非常简单的csv,其中包含以下数据,在tar.gz文件中压缩.我需要使用pandas.read_csv在数据框中读取它.
A B
0 1 4
1 2 5
2 3 6
import pandas as pd
pd.read_csv("sample.tar.gz",compression='gzip')
Run Code Online (Sandbox Code Playgroud)
但是,我收到错误:
CParserError: Error tokenizing data. C error: Expected 1 fields in line 440, saw 2
Run Code Online (Sandbox Code Playgroud)
以下是read_csv命令的集合以及我得到的不同错误:
pd.read_csv("sample.tar.gz",compression='gzip', engine='python')
Error: line contains NULL byte
pd.read_csv("sample.tar.gz",compression='gzip', header=0)
CParserError: Error tokenizing data. C error: Expected 1 fields in line 440, saw 2
pd.read_csv("sample.tar.gz",compression='gzip', header=0, sep=" ")
CParserError: Error tokenizing data. C error: Expected 2 fields in line 94, saw 14
pd.read_csv("sample.tar.gz",compression='gzip', header=0, sep=" ", engine='python')
Error: …Run Code Online (Sandbox Code Playgroud) 我的Ubuntu网络服务器上有大量的gzip压缩文件,我需要将它们转换成拉链.我想这可以用脚本完成,但我应该使用什么语言,以及如何解压缩和重新压缩文件?