存储库中的大型测试数据集

sup*_*pyo 7 git testing repository

假设我正在开发一些开源软件,用解释语言编写,作为Git仓库管理,需要大型数据集(+300 MB)进行基本测试.

测试数据是否应该与源代码进入同一个存储库,并使用compileToZipFile.sh发布版本的脚本?存储为两个单独的存储库,srcRepotestRepo会更好吗?

任何最佳做法/惯例将不胜感激.

Bri*_*ian 1

我认为这个问题的最佳答案将基于需求。

在我的工作中,我们按环境类型分隔代码/测试数据,例如:

  • 测试
  • 质量保证
  • 分期
  • 生产

某些环境具有与生产相同的数据,而其他环境则具有较旧的(或完全不同的)数据。这样做的好处是:

  • 用于测试、实施和“玩”新想法/技术的沙箱。
  • 您不会影响面向客户的实时数据。
  • 集成测试可以迎合/集中于与主代码库无关的某些方面。

现在,关于你的问题......正如我上面提到的,数据隔离使我们能够快速做出更改并实现新功能,因为我们使用的数据集中于我们正在测试的数据。我们有三个主干,它们都有独立的测试数据,这些数据特定于需要测试的内容。当测试时,View我们有一组测试,当测试时,Model我们有另一组测试,当测试时,Controller我们还有另一组测试。最后,我们有一组在新版本发布时运行的总体集成测试。除了最后一种情况外,在所有情况下,测试都与为其创建的组件一起存在;但同样,由于它们是集成测试,因此将它们与它们验证的三个部分分开保存是有意义的。

我认为你的想法是可靠的。