我正在开展一个项目,涉及分析几个非常大的文本文件。我已将项目分成几个部分,每个部分都将在自己的 RMarkdown/R Notebook 中完成,但我遇到了真正的问题。
第一个是,当我正在处理一部分(一个 R 文件)时,我必须定期rm使用变量并重新捕获内存gc()。当我准备好编织文件时,我认为 R 将重新运行所有内容 - 这意味着我需要使用 rm/gc 步骤显式地分块写入。它是否正确?我知道你可以将选项放在cache = TRUE块选项中,但我以前没有这样做过。如果我这样做,所有这些结果是否都保存在内存中(即缓存中)?如果是这样,当我删除变量并重新捕获内存时会发生什么?这是保存演示结果而无需重新运行所有内容的正确方法吗?
谢谢!
我有一个中等大小的数据集,为 1000 行 x 81 列。我想使用 的输出str(),但我想以“更漂亮”的方式呈现它。我尝试过这样的事情:
df %>% str() %>% kableExtra::kbl() %>% kableExtra::kable_minimal()
Run Code Online (Sandbox Code Playgroud)
和
tbl_summary(as.data.frame(str(df)))
Run Code Online (Sandbox Code Playgroud)
但两者都不起作用。我没有str()与任何特定的套餐结婚或结婚,但这就是我想要的总结。
最后,这旨在生成一个 HTML 文件,但我希望它也能处理 PDF 输出。
关于如何做到这一点有什么想法吗?