我想验证像 Zip 这样的多部分压缩文件,因为当压缩文件缺少任何部分时,它会引发错误,但我想在提取之前验证它,不同的软件会创建不同的命名结构。
我还提到了一个与DotNetZip相关的问题。
下面的截图来自 7z 软件。
第二个屏幕截图来自 C# 的 DotNetZip。
还有一件事是我还想测试它是否也已损坏或不像 7z 软件。请参阅下面的屏幕截图了解我的要求。
请帮我解决这些问题。
在 R 中,我可以将整个压缩文本文件读入字符向量,如下所示
readLines("file.txt.bz2")
Run Code Online (Sandbox Code Playgroud)
readLines透明地解压缩 .gz 和 .bz2 文件,但也适用于非压缩文件。朱莉娅有类似的东西吗?我可以
text = open(f -> read(f, String), "file.txt")
Run Code Online (Sandbox Code Playgroud)
但这无法打开压缩文件。读取 bzip2 文件的首选方式是什么?有没有什么方法(除了手动检查文件扩展名)可以自动推断压缩格式?
我有一些svg文件希望通过git. 但是,大多数软件都可以透明处理svgz(基本上是svg.gz)。因此,我正在考虑切换到svgz以节省磁盘空间。
将它们作为svgz而不是svg从一个git角度来看有什么优点和缺点?
我天真的想法是git 差异算法针对文本文件进行了优化,并且在它们的压缩副本上效果不佳。由于差异也被压缩,我认为整体方法对于文本文件非常有效,其中差异占用的磁盘空间非常少。相反,对于压缩数据,它倾向于在内部保存更大的文件,最终我预计存储库最终可能会为压缩文件占用更多空间。
客户端应该将压缩文件上传到 S3 文件夹中。然后下载并解压缩压缩文件以对其包含的文件执行各种操作。最初我们告诉客户将其文件压缩成ZIP文件,但事实证明这对我们的客户来说太困难了。相反,它提交了一个带有 ZIP 扩展名的RAR文件……多么聪明啊。由于显而易见的原因,人们无法使用ZIP解压缩算法来解压缩RAR文件。
因此,鉴于我正在 Linux 操作系统上使用 Amazon SDK 开发 Java 项目,我正在寻找一种方法来找出 S3 下载文件的文件类型。我将根据获得的文件类型来处理如何解压缩文件。
我已经研究过许多堆栈溢出问题,例如这个问题,但仅通过查看它们(及其注释),似乎没有一个问题是 100% 有效的。
找出压缩文件类型的最佳方法是什么?
在工作中,我正在实现一个可处理文件的新Web服务。规范说,如果压缩了.zip文件,我们将不接受。
是否存在未压缩的.zip文件?如果是的话,您认为使用Java(1.8)检测一个的最佳方法是什么?