由于包对象失败,git fetch失败

Question

由于包对象失败,git fetch失败

当我将远程存储库添加为上游并尝试获取它时,它会失败,如下所示:

    $ git fetch upstream
    remote: Counting objects: 11901, done.
    remote: aborting due to possible repository corruption on the remote side.
    error: pack-objects died of signal 9
    error: git upload-pack: git-pack-objects died with error.
    fatal: git upload-pack: aborting due to possible repository corruption on the re
    mote side.
    fatal: protocol error: bad pack header

Run Code Online (Sandbox Code Playgroud)

我知道它由于存储库中存在大量文件而失败(我们确实有),但为什么克隆相同的存储库时它不会失败？因为我能够成功克隆存储库.不应该在克隆请求时打包相同的对象吗？

Answer 1

tor*_*rek 12

为了扩展VonC的答案 ......

首先,它可能有助于注意signal 9引用SIGKILL并且倾向于发生因为所讨论的远程是Linux主机并且该进程被Linux "OOM杀手"破坏(尽管一些非Linux系统表现相似).

接下来,我们来谈谈对象和包文件.git"对象"是在git存储库中找到的四种类型的项目之一:"blob"(文件); 一个"树"(一个blob列表,它们的模式,以及它们的名称 - 存储在一个目录中:即,当解压缩提交时将成为目录或文件夹的内容); "提交"(在其他数据中提供提交作者,消息和顶级树); 和"标签"(带注释的标签).对象可以存储为"松散对象",文件中的一个对象全部存在; 但是这些可能占用大量的磁盘空间,因此可以将它们"打包",将许多对象放入一个文件中并添加额外的压缩.

从大量松散的对象中制作一个包,进行这种压缩,是(或至少可以)一个CPU和内存密集型操作.所需的内存量取决于对象的数量及其基础大小:大文件占用更多内存.许多大文件占用了大量内存.

接下来,正如VonC所说,git clone跳过尝试使用"瘦"包(好吧,通常无论如何).这意味着服务器只提供它已有的包文件.这是一种"内存便宜"的操作:文件已经存在,服务器只需要提供它们.

另一方面,git fetch尝试(如果可以)避免发送客户端已有的大量数据.使用"智能"协议,客户端和服务器进行某种对话,您可以将其视为如下所示:

"我有对象A,需要B和C;你有B和C吗？我也有D,E和F."
"我有B,但我需要C,我有D和E;请发给我A,C和F."

如此通知,服务器从原始包中提取"有趣的"/"想要的"对象,然后尝试将它们压缩成新的(但"瘦")包.这意味着服务器将调用git-pack-objects.

如果服务器内存不足("低"相对于需要的量git-pack-objects),则可能会调用"OOM杀手".由于git-pack-objects内存密集,该过程很可能成为杀死"OOM杀手"的候选人.然后,在客户端看到有关git-pack-objects从signal 9(SIGKILL)中死亡的消息.

(当然,服务器的OOM杀手可能完全杀掉其他东西,比如bug数据库服务器.:-))

归档时间：	11 年，10 月前
查看次数：	6313 次
最近记录：	10 年，12 月前