我试图在一个非常大的数据集的R中创建一个boxplot.包含数据的文件是2.5G,如果我尝试导入它会崩溃R. 幸运的是,其他一些(python)软件可以毫无问题地生成均值和方差,这就是我真正想绘制的(现在).
到目前为止我发现的每个教程都要求你输入完整的数据集,然后R计算统计数据本身,但我想知道如何将平均值,中位数,最小值,最大值等传递给bwplot只是为了绘图.我更喜欢R和晶格的原因是因为它与代码可能最终的软件套件很好地集成.如果我使用matlab或其他软件会有问题,因为它将是我们当前用户的另一个要求.
箱形图不绘制均值或方差.您实际上需要完整的排名数据来绘制正确的箱线图,因为数量是中位数,四分位数和1.5倍IRQ内的关闭数据点的实际值加上超出该范围的所有数据点(异常值).对于大型数据集来说,这通常不是一个好主意(因为根据定义,您有数百万个异常值).
也就是说,您可以按照您想要的方式生成基本摘要并用于bxp绘制它们 - 请参阅?bxpR.如果不是上述内容,请确保说明您正在绘制的数量.