Jer*_*lim 13
总的来说,我确实采用了Dirk的策略.您应该将代码作为完全可重现的记录,以便将原始数据转换为输出.
但是,如果您有复杂的代码,则可能需要很长时间才能重新运行它.我有超过30分钟处理数据的代码(即导入,转换,合并等).在这些情况下,单个数据破坏代码行需要我等待30分钟才能恢复我的工作区.通过破坏代码的数据我的意思是:
x <- merge(x, y)df$x <- df$x^2例如,合并,用转换替换现有变量,删除行或列,等等.在这些情况下,这很容易,特别是在第一次学习R出错时.
为了避免等待这30分钟,我采取了几种策略:
temp <- merge(x, y);检查它是否有效str(temp); head(temp); tail(temp)以及是否一切都很好x <- merge(x, y)save(x, y, z , file = 'backup.Rdata')那样,如果我犯了错误,我只需要重新加载这些对象.df$x <- NULL 是一种删除您不想创建的数据框中的变量的便捷方法但是,最后我仍然从头开始运行所有代码以检查结果是否可重现.