Bur*_*000 6 c# gzip common-crawl
我按照 Microsoft 推荐的方式解压缩 .gz 文件:
https://learn.microsoft.com/en-us/dotnet/api/system.io.compression.gzipstream?view=netcore-3.1
我正在尝试从 CommonCrawl 下载并解析文件。我可以成功下载它们,并使用 7-zip 解压它们
然而,在 c# 中我得到:
System.IO.InvalidDataException:“存档条目是使用不受支持的压缩方法进行压缩的。”
public static void Decompress(FileInfo fileToDecompress)
{
using (FileStream originalFileStream = fileToDecompress.OpenRead())
{
string currentFileName = fileToDecompress.FullName;
string newFileName = currentFileName.Remove(currentFileName.Length - fileToDecompress.Extension.Length);
using (FileStream decompressedFileStream = File.Create(newFileName))
{
using (GZipStream decompressionStream = new GZipStream(originalFileStream, CompressionMode.Decompress))
{
decompressionStream.CopyTo(decompressedFileStream);
Console.WriteLine($"Decompressed: {fileToDecompress.Name}");
}
}
}
}
Run Code Online (Sandbox Code Playgroud)
该文件来自那里:
有谁知道是什么问题?我需要一个特殊的图书馆吗?