我不想使用操作系统命令,因为它使操作系统依赖于操作系统.
这是提供tarfile,tarfile.is_tarfile(filename)以检查文件是否是一个tar文件或没有.
我无法在gzip模块中找到任何相关命令.
编辑:为什么我需要这个:我有gzip文件列表,这些文件大小不一(1-10 GB),有些是空的.在读取文件(使用pandas.read_csv)之前,我想检查文件是否为空,因为对于空文件,我收到错误pandas.read_csv.(错误如:预期15列,找到-1)
带错误的示例命令:
import pandas as pd
pd.read_csv('C:\Users\...\File.txt.gz', compression='gzip', names={'a', 'b', 'c'}, header=False)
Too many columns specified: expected 3 and found -1
Run Code Online (Sandbox Code Playgroud)
熊猫版本是0.16.2
用于测试的文件,它只是一个空文件的gzip.
我有一个我不想提取的存档,但检查它的每个内容是文件还是目录.
os.path.isdir和os.path.isfile不起作用,因为我正在处理归档.存档可以是tar,bz2,zip或tar.gz中的任何一个(因此我不能使用他们的特定库).此外,代码应该适用于任何平台,如Linux或Windows.任何人都可以帮我怎么做?
我有一个巨大的*.tar.gz文件,我想查看其中包含的文件列表而不提取内容(最好每个文件使用mtimes).我怎么能在python中实现这一点?
python ×3
gzip ×2
archive ×1
compression ×1
extraction ×1
file ×1
pandas ×1
python-2.7 ×1
zip ×1