如何使用Git组织一系列科学实验

Vic*_*tor 18 git scientific-computing

我正在模型上运行实验,其工作流程如下:

  • 我在模型中工作(Python中的软件)
  • 我更改了一些参数并运行实验
  • 然后,我将存储实验结果(作为泡菜).
  • 然后,我将使用另一个软件(IPython笔记本)分析(酸洗)结果.

我正在使用Git和Scientific Reproducibility作为指南,其中实验的结果存储在提交哈希表中的表中.我想将结果存储在目录中,将目录命名为哈希.

考虑版本控制,我想隔离codeanalysis.例如,IPython笔记本中的图中颜色的变化analysis不应该改变任何内容code

我在想的方法:

像这样的目录结构:

model
- code
- simulation_results
   - a83bc4
   - 23e900
   - etc 
- analysis
Run Code Online (Sandbox Code Playgroud)

并针对不同的Git仓库code,并analysis留下simulation_results了的Git.

任何意见?更好的解决方案?谢谢.

Von*_*onC 4

这看起来不错,你的结构非常适合使用git submodulesmodel成为父 git 存储库。

这样,您将链接在一起code,并且analysisSHA1 在model链接在一起。

model/simulation_results这意味着您可以根据存储库(“父”存储库)的 SHA1在私有(即非版本控制)目录中创建目录:SHA1 链接两个模块和子模块model的 SHA1 ,这意味着您可以准确地重现实验(基于关于和的确切内容)。projectanalysisprojectanalysis