我有一个800k行的数据集,每个都有一个时间戳.数据涵盖一年的时间范围.
在准备我想要制作的堆积区域图时,我想创建26个子组(例如,两周间隔).在这些子组中,我想找到5个类中的值的频率.
例如:在前两周,这些值的百分比是> x && <= y,有多少是> y && <= z等.
所有这些都应该导致ggplot2库及其geom_area()函数创建的堆积区域图.
这是数据集的头部:
date transaction_volume transaction_costs
47 2015-01-01 3.985826 0.03157
59 2015-01-01 3.955749 0.03157
71 2015-01-01 0.315700 0.03157
72 2015-01-01 0.315700 0.03157
73 2015-01-01 0.315700 0.03157
74 2015-01-01 0.315700 0.03157
Run Code Online (Sandbox Code Playgroud)