我可以将 Subversion 用于多 GB 数据集吗?

Lot*_*har 5 svn version-control mercurial

该数据集包含 6766 个文件夹中的 97984 个文件,大小为 2.57 GB。其中很多是二进制文件。

对我来说,这听起来并不那么重要。大约 50 个文件的每日数据更改率为数百 KB。但我担心颠覆会变得极其缓慢。

无论如何,它从来都不是很快,最后一次在 v1.2 时,建议将其分成多个存储库。不,我不喜欢这个。

有没有办法让我告诉 Subversion 或任何其他免费的开源版本控制信任文件修改时间/文件大小来检测文件更改而不是比较所有文件?有了这个,并将数据放在快速的现代 SSD 上,它应该可以快速运行,例如,完整提交的时间不到 6 秒(这比从 Windows 资源管理器属性对话框中获取摘要要快 3 倍)。

Jim*_*m T 3

我刚刚在我的机器上做了一个基准测试,看看情况如何:

Data size - 2.3Gb (84000 files in 6000 directories, random textual data)
Checkout time 14m
Changed 500 files (14M of data changes)
Commit time 50seconds
Run Code Online (Sandbox Code Playgroud)

为了了解手动比较所有这些文件需要多长时间,我还对该数据的 2 个导出(版本 1 与版本 2)进行了比较。

Diff time: 55m
Run Code Online (Sandbox Code Playgroud)

我不确定 SSD 是否能像您希望的那样缩短提交时间,但我使用普通的单SATA磁盘来进行 50 秒和 55 分钟的比较。

对我来说,这些时候强烈表明 svn 默认情况下不会检查文件的内容。

这是使用 svn 1.6 时的情况。