两者有什么区别?我们在上一份工作中使用了git-lfs,并且在我当前的工作中开始与git一起使用dvc。它们都放置某种索引而不是文件,可以按需下载。dvc是否比前一个有所改进?
DVC并不比 git-lfs 好:它们完全不同。所选答案在很大程度上是有偏见的。两者都是不同的工具,用于不同的目的。
git status,并且您可能会丢失此类更改,除非您使用 dvc 进行额外检查。DVC 与 git-lfs 有不同的用途。DVC不仅用于保存大文件,而且主要用于管理由确定性过程产生的大文件。所以,除了存储大文件之外,dvc 也像Makefiles 一样,通过在 a 中定义依赖来控制处理管道,Makefile如果处理输入(也是 dvc 跟踪的文件或参数)发生变化,dvc 会计算必须重新生成哪些文件(是的,就像Makefiles)。这就是为什么 DVC 通常被描述为数据科学的 makefile 工具。如果您要生成大量的大型 AI 模型或繁重的数据文件,那就太酷了。
就个人而言,我将两者都用于大文件存储。git-lfs 简化了大文件管理,但 dvc 简化了大文件存储(这简化了管理),代价是没有这种透明度,有时会丢失数据。我仍然不使用 dvc 进行管道计算,直到现在我更喜欢我自己的实现。DVC 越来越好,也许我以后会更多地使用它。
DVC是的更好替代git-lfs。
与git-lfs不同,DVC不需要安装专用服务器。它可以在本地(例如NAS,SSH)或任何主要云提供商(S3,Google Cloud,Azure)上使用。
有关更多信息:https : //dvc.org/doc/use-cases/data-and-model-files-versioning
| 归档时间: |
|
| 查看次数: |
92 次 |
| 最近记录: |