如何使用 GZipStream 在内存中解压缩 gz 文件?

Jax*_*ian 1 c# compression gzip gzipstream

我可能在这里做了一些明显愚蠢的事情。请指出!

我有一些 C# 代码,可以从 SFTP 中提取一堆 .gz 文件(使用SSH.NET Nuget 包- 效果很好!)。每个 gz 内部只包含一个 .CSV 文件。我想将这些文件保留在内存中而不访问磁盘(是的,我知道,存在服务器内存管理问题 - 这很好,因为这些文件相当小),在内存中解压缩它们以提取其中的 CSV 文件,然后返回一组自定义 DTO 中的 CSV 文件 ( FtpFile)。

我的问题是,虽然来自 SFTP 连接的 MemoryStream 中有数据,但它似乎从未填充到我的 GZipStream 中,或者从 GZipStream 到输出 MemoryStream 的复制失败。我尝试过使用自己的缓冲区对 Read 进行更传统的循环,但它的结果与此代码相同。

除了连接详细信息(它连接成功,所以不用担心),这是我的所有代码:

逻辑

    public static List<FtpFile> Foo()
    {
        var connectionInfo = new ConnectionInfo("example.com",
            "username",
            new PasswordAuthenticationMethod("username", "password"));
        using (var client = new SftpClient(connectionInfo))
        {
            client.Connect();

            var searchResults = client.ListDirectory("/testdir")
                .Where(obj => obj.IsRegularFile
                              && obj.Name.ToLowerInvariant().StartsWith("test_")
                              && obj.Name.ToLowerInvariant().EndsWith(".gz"))
                .Take(2)
                .ToList();

            var fileResults = new List<FtpFile>();

            foreach (var file in searchResults)
            {
                var ftpFile = new FtpFile { FileName = file.Name, FileSize = file.Length };

                using (var fileStream = new MemoryStream())
                {
                    client.DownloadFile(file.FullName, fileStream); // Success! All is good here, so far. :)

                    using (var gzStream = new GZipStream(fileStream, CompressionMode.Decompress))
                    {
                        using (var outputStream = new MemoryStream())
                        {
                            gzStream.CopyTo(outputStream);
                            byte[] outputBytes = outputStream.ToArray(); // No data. Sad panda. :'(
                            ftpFile.FileContents = Encoding.ASCII.GetString(outputBytes);
                            fileResults.Add(ftpFile);
                        }
                    }
                }
            }

            return fileResults;
        }
    }
Run Code Online (Sandbox Code Playgroud)

FtpFile(只是我正在填充的一个简单的 DTO):

public class FtpFile
{
    public string FileName { get; set; }
    public long FileSize { get; set; }
    public string FileContents { get; set; }
}
Run Code Online (Sandbox Code Playgroud)

PSA如果有人来复制此代码,请注意这不是好代码,因为此代码可能会遇到一些严重的内存管理问题!最佳实践是将其流式传输到磁盘,但此代码中并未执行此操作!我的需求非常具体,因为我必须将这些文件同时保存在内存中才能使用它们进行构建。

Stf*_*Bln 5

如果要将数据插入流中,请确保在解压缩之前返回其原始位置。

以下内容应该可以解决您的问题:

            using (var fileStream = new MemoryStream())
            {
                client.DownloadFile(file.FullName, fileStream); // Success! All is good here, so far. :)
                fileStream.Seek(0, SeekOrigin.Begin);

                using (var gzStream = new GZipStream(fileStream, CompressionMode.Decompress))
                {
                    using (var outputStream = new MemoryStream())
                    {
                        gzStream.CopyTo(outputStream);
                        byte[] outputBytes = outputStream.ToArray(); // No data. Sad panda. :'(
                        ftpFile.FileContents = Encoding.ASCII.GetString(outputBytes);
                        fileResults.Add(ftpFile);
                    }
                }
            }
Run Code Online (Sandbox Code Playgroud)