Git Scalar 用于管理许多大文件?

Ver*_*ahn 5 git repository

当存储库包含许多大数据资产(例如纹理、3D 模型、虚拟环境、经过训练的神经网络、音频文件等)时,由于不同的原因,“普通”Git 并不是一个好的选择,例如:

  • 获取/克隆速度下降
  • 由于磁盘空间有限,用户可能无法签出存储库(例如,当存储库 > 1 TB 时)

然而,希望能够在一个存储库中一起管理数据和源代码。

有 Git LFS,但它有一些缺点,例如:

  • 引用的文件可能会被意外删除,因为它们不是“真实”存储库的一部分
  • 在分支之间切换时,杂项 git LFS 问题
  • 用户有时会忘记签入 Git LFS 文件
  • 如果参考文件稍后移动到另一个位置,则没有良好的迁移路径(旧提交将指向无效的文件位置)

最近,Git标量被添加到 Git 中。

我想知道 git scalar 是否可以解决前面提到的问题。目前,我使用 Perforce 来管理我的存储库,因为它似乎是唯一可以处理存储库中的大文件并拥有良好支持/社区的版本控制系统。

这里有人有使用 git scalar 来管理包含许多大数据资产的大型单一存储库的经验吗?对于这样的设置,有更好的提供商吗?Azure 对 Git Scalar mono 存储库有良好的支持吗?或者 Scalar 只适用于小文件 (< 100 MB)?