是否期望将大型ggplot打印到PDF会导致RSession内存膨胀?我有一个大约72兆字节的ggplot2对象.打印到PDF时,我的RSession增长到2 gig以上.这是预期的吗?有没有办法优化性能?我发现得到的PDF很大~25meg,我必须使用外部程序将它们缩小(50kb,没有视觉损失!).有没有办法用较低质量的图形打印到PDF?或者也许是一些我没有考虑过的打印参数或ggplot?
对于大型数据集,我发现在将数据放在一起之前预先处理数据是有帮助的ggplot(即使ggplot提供相同的计算).
ggplot必须非常通用:它无法预测您想要在以后添加的统计数据或地理位置,因此很难对其进行优化(拆分 - 应用 - 合并策略可能会导致中间内存需求爆炸).OTOH,你知道你想要什么,可以相应地预先计算.
大的pdf表示您要么有大量的过度绘图,要么生成的对象太小而无法看到.在这两种情况下,您都可以通过应用适当的摘要统计数据(例如hexbin或boxplot而不是scatterplot)获得很多收益.
我想如果没有你正在做的事情的细节,我们不能告诉你更多.因此,请创建一个最小的示例和/或上传您正在生成的压缩图.