如何制作一个很好的R可重复的例子

在与同事讨论性能,教学,发送错误报告或在邮件列表上搜索指导时,以及在Stack Overflow上,通常会询问可重复的示例并始终提供帮助.

您有什么建议创建优秀示例的提示？如何以文本格式粘贴r中的数据结构？您还应该包含哪些其他信息？

在另外还有其他招数来使用dput(),dump()或structure()？你什么时候应该包括library()或require()声明？其中保留字应避免一个,此外c,df,data等？

怎样才能成为一位伟大的[R重复的例子？

r r-faq

And*_*rie

2018 08-20

2474
推荐指数

23
解决办法

28万
查看次数

不同数据集上相同值的一致因子水平

我不确定我是否完全理解因素是如何运作的。因此，如果我错了，请以易于理解的方式纠正我。

我总是假设在进行回归时，R 在幕后将分类变量转换为整数，但这部分超出了我的思路。

它将使用训练集中的分类值，并在构建模型后，检查测试数据集中的相同分类值。无论潜在的“水平”是什么——对我来说都无关紧要。

但是，我一直在思考更多......并且需要澄清 - 特别是如果我在如何解决这个问题上做错了。

     train= c("March","April","January","November","January")
     train=as.factor(train)
     str(train)
     Factor w/ 4 levels "April","January",..: 3 1 2 4 2

     test= c(c("March","April"))
     test=as.factor(test)
      str(test)
     # Factor w/ 2 levels "April","March",..:  1 2

Run Code Online (Sandbox Code Playgroud)