我需要得到一个累积变量的洛伦兹曲线图作为观测数量的函数.我希望两个轴都以百分比显示(例如,观察是买家的数量,y变量是他们购买的数量,买家已经按降序排列,我想得到的图表是"前10名" %购买者购买了总购买量的90%").我的数据集是几百万次观察.
做这个的最好方式是什么?子问题:
如果我需要为总观测值的分位数添加两个变量并且总买入$(以便使用它们来绘制),那么返回行号的对象是什么?我试过了:
user_quantile <- row(df)/nrow(df)
但我得到一个相同列的矩阵(user_quantile.1,user_quantile.2),其中我只需要一列.
是否有任何方法可以跳过添加百分比作为变量,只有轴数值?
情节可以达到很多点,而不是我需要的线.什么是最小化计算工作并获得漂亮图表的最佳方法?
谢谢.
| 归档时间: |
|
| 查看次数: |
1572 次 |
| 最近记录: |