洛伦兹曲线图

Rob*_*rto 3 r

我需要得到一个累积变量的洛伦兹曲线图作为观测数量的函数.我希望两个轴都以百分比显示(例如,观察是买家的数量,y变量是他们购买的数量,买家已经按降序排列,我想得到的图表是"前10名" %购买者购买了总购买量的90%").我的数据集是几百万次观察.

做这个的最好方式是什么?子问题:

如果我需要为总观测值的分位数添加两个变量并且总买入$(以便使用它们来绘制),那么返回行号的对象是什么?我试过了:

user_quantile <- row(df)/nrow(df)

但我得到一个相同列的矩阵(user_quantile.1,user_quantile.2),其中我只需要一列.

是否有任何方法可以跳过添加百分比作为变量,只有轴数值?

情节可以达到很多点,而不是我需要的线.什么是最小化计算工作并获得漂亮图表的最佳方法?

谢谢.

Dir*_*tel 8

您可能想要了解R内容的优秀RSeek搜索引擎.Lorentz曲线(和Lorenz曲线)的一个快速查询导致这些包:

  • ineq:衡量不平等,集中和贫困
  • reldist:相对分配方法
  • GeoXp:交互式探索性空间数据分析
  • lawstat:生物统计学,公共政策和法律的R包

所有这些似乎都提供了洛伦兹曲线功能.