小编Not*_*ers的帖子

Git找到历史记录中的所有二进制文件

对不起,如果这是上一个问题的重复,但我找不到我正在寻找的东西.我正在将一个大型cvs代码集(20多个存储库,有15年的历史--10-15 GB大小)转换为git.大部分的大小是由于过去与代码一起提交的二进制文件.虽然一些二进制文件是可以完全删除的文件,但是保留其中许多文件以及它们的历史记录是可取的.但是,我们不希望回购膨胀.

我们目前正计划使用git-fat来存储二进制文件,但我正在编写脚本来自动转换文件.我的第一步是尝试识别repo中包含二进制文件的所有文件(包括已删除的文件).有没有简单的方法来实现这一目标?谢谢你的帮助

编辑

我实际上认为我找到了一个合理的方法,我只是跑

git log --numstat <first commit hash> HEAD
Run Code Online (Sandbox Code Playgroud)

这将打印出前面有两列的所有文件的列表,第一列包含文件的更改次数(我不确定它是以字节还是行为单位).但重要的部分是二进制文件,它是' - '.通过选择带有此标记的行,并将它们"唯一",我相信我会获得完整的二进制文件列表.

这个策略有什么缺陷吗?

git binaryfiles

9
推荐指数
2
解决办法
2631
查看次数

标签 统计

binaryfiles ×1

git ×1