在C＃中使用GZIP压缩并在python中解压缩失败

169

卡米洛·特雷文托（Camilo Terevinto）

我有一个流程，其中某些数据（例如图像/视频）使用GZip压缩，如下所示：

await using var outputStream = new MemoryStream();
await using var compressionStream = new GZipStream(outputStream, CompressionMode.Compress);

await compressionStream.WriteAsync(payload);
await compressionStream.FlushAsync();

outputStream.Position = 0;
return outputStream.ToArray()

上面的代码不是我的团队提供的，但是可以根据需要进行更改。

如果我将输出转换成base64字符串并使用此简单代码测试将其解压缩，则可以正常工作：

var bytes = Convert.FromBase64String("H4sIAAAAAAAACirOz01VKEmtKAEAAAD//w=="); // "some text"
using var ms = new MemoryStream(bytes);
using var ds = new GZipStream(ms, CompressionMode.Decompress);
using var output = new MemoryStream();
ds.CopyTo(output);
ds.Flush();

var result = output.ToArray();

但是，我的要求是在python脚本中获取压缩的有效负载，并在将其传递到另一个系统之前对其进行解压缩。我对python一点都不熟悉，所以我做了一个非常简单的脚本：

import base64
import gzip

encodedBase64 = "H4sIAAAAAAAACirOz01VKEmtKAEAAAD//w=="
decodedBytes = base64.standard_b64decode(encodedBase64)
decompressedBytes = gzip.decompress(decodedBytes)

上面的失败与： EOFError: Compressed file ended before the end-of-stream marker was reached

我当然进行了研究，发现了类似这样的问答，但没有任何帮助（例如，使用该答案失败gzip.BadGzipFile: Not a gzipped file (b'\x00\x00')。其他尝试产生了不同的gzip错误。

广州7

在GzipStream需要你读它的输出之前处置。Gzip有一个页脚，需要将其添加到流的末尾，并且通过Dispose()（也通过Close()）（而不是通过Flush()）添加。我想这很有意义，因为Flush()在编码过程中可能会多次调用它，所以添加页脚将是错误的位置。

我重写了您的代码以将对象放置在适当的位置，并且async由于您正在处理纯同步操作，因此也摆脱了它：

public static string Encode()
{
    var payload = Encoding.ASCII.GetBytes("some text");
    using (var outputStream = new MemoryStream())
    {
        using (var compressionStream = new GZipStream(outputStream, CompressionMode.Compress))
        {
            compressionStream.Write(payload);
        }
        var result = outputStream.ToArray();
        return Convert.ToBase64String(result);
    }   
}

这产生输出

H4sIAAAAAAAAAyvOz01VKEmtKAEAur26TwkAAAA=

它比您看到的输出稍长，表明它包含Python期望的页脚。至少在.NET中，它仍会解码为相同的结果。

有趣的GzipStream是，.NET对于缺少页脚具有强大的功能，但Python版本不支持。

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-01-26

我来说两句

0 条评论

登录后参与评论

上一篇：使用声明式管道的waitUntil实现依赖并行任务的更优雅方法

TOP 榜单

文章

在C＃中使用GZIP压缩并在python中解压缩失败

在C＃中使用GZIP压缩并在python中解压缩失败

Android Studio Kotlin：提取为常量

计算数据帧R中的字符串频率

如何使用Redux-Toolkit重置Redux Store

http：// localhost：3000 /＃！/为什么我在localhost链接中得到“＃！/”。

如何使用tweepy流式传输来自指定用户的推文（仅在该用户发布推文时流式传输）

TreeMap中的自定义排序

TYPO3：将 Formhandler 添加到新闻扩展

遍历元素数组以每X秒在浏览器上显示

在Ubuntu和Windows中，触摸板有时会滞后。硬件问题？

警告消息：在matrix（unlist（drop.item），ncol = 10，byrow = TRUE）中：数据长度[16]不是列数的倍数[10]>？

无法连接网络并在Ubuntu 14.04中找到eth0

将辅助轴原点与主要轴对齐

我可以ping IPv6但不能ping IPv4

在Jenkins服务器中使用Selenium和Ruby进行的黄瓜测试失败，但在本地计算机中通过

提交html表单时为空

使用C ++ 11将数组设置为零

如果从DB接收到的值为空，则JMeter JDBC调用将返回该值作为参数名称

尝试在Dell XPS13 9360上安装Windows 7时出错

如何在R中转置数据

无法使用 envoy 访问 .ssh/config

未捕获的SyntaxError：带有Ajax帖子的意外令牌u