我有一个 174603 行和 178 列的数据框,我正在使用 openxlsx::saveWorkbook 将其导入 Excel(使用此包获取上述单元格格式、颜色、标题样式等)。但是这个过程非常缓慢,(取决于机器使用的内存量,它可能需要 7 到 17 分钟!!)我需要一种方法来显着减少这种情况(不需要几秒钟,但下面的任何事情5分钟就可以了)
我已经搜索了其他问题,但它们似乎都集中在导出到 R(我对此没有问题)或将非格式化文件写入 R(使用 write.csv 和其他类似选项)
显然我无法使用 xlsx 包,因为我的计算机上的设置(工业计算机,查看此问题的评论)
任何有关此包中的包或其他功能以加快运行速度的建议将不胜感激。
我有一个数据框,如下所示:(还有很多要评估的列和行)
ID COL1 COL2 COL3 COL4
1 x x
2 x x
3
4 x x
5 x
Run Code Online (Sandbox Code Playgroud)
我想获得X在第1-4列(不为每个ID计数之前的外观)中的外观总和,对于上面给出的示例,答案是:
COL1 COL2 COL3 COL4
2 1 1 0
Run Code Online (Sandbox Code Playgroud)
我详细说明:我对每个ID的第1列中的所有错误进行计数,然后进入第二列,发现尽管该列中有两个标记,但其中一个属于ID 1,这已经在第1列中说明了。因此,第2列仅出现1个新的外观,第3列只有一个错误,第4列没有新的错误,因为该列中的两个外观均已被考虑。