我有一个tar文件,里面有多个文件.我需要编写一个python脚本,它将读取文件的内容并给出总字符数,包括字母总数,空格,换行符,所有内容,而不用解压缩tar文件.
对于前abc.tar.gz有
abc/file1.txt
abc/file2.txt
abc/abc1/file3.txt
abc/abc2/file4.txt
我需要读取/显示file3.txt的内容而不解压缩文件.
感谢您的任何意见.
我有一个.gz文件,我需要使用python获取其中的文件名。
这个问题是一样的这一个
唯一的区别是我的文件.gz不是,.tar.gz所以tarfile库在这里没有帮助我
我正在使用requests库来请求URL。响应是一个压缩文件。
这是我用来下载文件的代码
response = requests.get(line.rstrip(), stream=True)
if response.status_code == 200:
with open(str(base_output_dir)+"/"+str(current_dir)+"/"+str(count)+".gz", 'wb') as out_file:
shutil.copyfileobj(response.raw, out_file)
del response
Run Code Online (Sandbox Code Playgroud)
例如,此代码以名称下载文件1.gz。现在,如果我使用存档管理器打开文件,则该文件将包含以下内容my_latest_data.json
我需要提取文件,输出为my_latest_data.json。
这是我用来提取文件的代码
inF = gzip.open(f, 'rb')
outfilename = f.split(".")[0]
outF = open(outfilename, 'wb')
outF.write(inF.read())
inF.close()
outF.close()
Run Code Online (Sandbox Code Playgroud)
该outputfilename变量是我在脚本中提供的字符串,但是我需要真实的文件名(my_latest_data.json)