存储库中的大型测试数据集

Question

存储库中的大型测试数据集

sup*_*pyo 7 git testing repository

假设我正在开发一些开源软件,用解释语言编写,作为Git仓库管理,需要大型数据集(+300 MB)进行基本测试.

测试数据是否应该与源代码进入同一个存储库,并使用compileToZipFile.sh发布版本的脚本？存储为两个单独的存储库,srcRepo和testRepo会更好吗？

任何最佳做法/惯例将不胜感激.

Answer 1

Bri*_*ian 1

我认为这个问题的最佳答案将基于需求。

在我的工作中，我们按环境类型分隔代码/测试数据，例如：

测试
质量保证
分期
生产

某些环境具有与生产相同的数据，而其他环境则具有较旧的（或完全不同的）数据。这样做的好处是：

用于测试、实施和“玩”新想法/技术的沙箱。
您不会影响面向客户的实时数据。
集成测试可以迎合/集中于与主代码库无关的某些方面。

现在，关于你的问题......正如我上面提到的，数据隔离使我们能够快速做出更改并实现新功能，因为我们使用的数据集中于我们正在测试的数据。我们有三个主干，它们都有独立的测试数据，这些数据特定于需要测试的内容。当测试时，View我们有一组测试，当测试时，Model我们有另一组测试，当测试时，Controller我们还有另一组测试。最后，我们有一组在新版本发布时运行的总体集成测试。除了最后一种情况外，在所有情况下，测试都与为其创建的组件一起存在；但同样，由于它们是集成测试，因此将它们与它们验证的三个部分分开保存是有意义的。

我认为你的想法是可靠的。

归档时间：	13 年前
查看次数：	230 次
最近记录：	10 年，9 月前