如何将随机种子分配给 dplyr sample_n 函数?

Eng*_*ica 4 r reproducible-research dplyr random-seed

这是来自 R 中 dplyr 的“sample_n”。
https://dplyr.tidyverse.org/reference/sample.html

为了可重复性,我应该放置一个种子,以便其他人可以获得我的确切结果。

是否有内置的方法来设置“sample_n”的种子?这是我在环境中做的事情并且“sample_n”响应它吗?

这些不是内置在“sample_n”函数中的。

  • 有环境“set.seed”功能[1]
  • 有一个库 'withr' 可以为代码[2]创建一个包含种子的包装器

.

Wal*_*ldi 5

dplyr::sample_n 文件 告诉:

这是一个围绕 sample.int() 的包装器,可以轻松地从表中选择随机行。它目前仅适用于本地 tbl。

所以在sample_n,sample.int被调用,这意味着使用标准的随机数生成器,并且您可以使用它set.seed来实现可重复性。

  • 也许可以在执行“sample_n”之前添加“set.seed(123)”*每次*需要调用的答案。 (3认同)