我有一个大数据框,其中有一列,具有一个组名,该组名与dplyr分组。因此,多行具有相同的组名。为了减少数据,我想从每个组的第一个元素中提取第n个元素。有没有循环的R方式吗?
用序列对每行进行子集化,存在经常丢失每个组的第一行的问题。例如
data[seq(1, nrow(data), 10), ] # Some groups start without the first row.
Run Code Online (Sandbox Code Playgroud)
输入:
Val Group
1 1.0 Fruit
2 2.0 Fruit
3 3.0 Fruit
4 1.5 Veg
5 2.8 Veg
6 4.2 Veg
7 5.1 Veg
Run Code Online (Sandbox Code Playgroud)
输出(第二个元素,请注意第三行!):
Val Group
1 1.0 Fruit
2 3.0 Fruit
**3 1.5 Veg**
4 4.2 Veg
Run Code Online (Sandbox Code Playgroud)