小编Sof*_*rki的帖子

基于多个变量从数据框中删除重复行

你好,我是法国的工程学学生,我有一个大学项目。目前,如果我的数据中的行在其列的值中相似,我想删除它们。我的数据库看起来像这样:

node   event   grade    std             date                 groupe           name 
6794   57605    100     659  2016-04-08 10:59:45.882267  cm1_mat_001_eap_001    c8

6794   84007     0      659  2016-04-29 13:44:47.156998  cm1_mat_001_eap_001    c8

6794   86729    100     659  2016-05-02 14:17:02.945516  cm1_mat_001_eap_001    c8

6794   88921    100     659  2016-05-04 09:00:52.157544  cm1_mat_001_eap_001    c8

6797   10119     0      659  2016-05-17 08:27:28.371022  cm1_mat_001_eap_001    c8

6794   98291    100     729  2016-05-12 08:27:13.920052  cm1_mat_001_eap_001    c8

6794   99711    100     729  2016-05-13 06:50:13.60001   cm1_mat_001_eap_001    c8

6812   87995    100     796  2016-05-03 07:33:31.108374  cm1_mat_002_eap_003    c8
Run Code Online (Sandbox Code Playgroud)

目前,如果列中的值相似,我想删除行。就我而言,如果“节点”和“标准”列中的值相似,我想根据此条件删除重复行并保留第一行。

6794   57605    100     659  2016-04-08 10:59:45.882267 cm1_mat_001_eap_001 …
Run Code Online (Sandbox Code Playgroud)

r duplicates

1
推荐指数
1
解决办法
1万
查看次数

基于相同的连续元素将数据帧拆分为列表

是否有一种有效的方法将基于列中相同连续元素的数据帧拆分为列表(并保持数据框元素在列表中的顺序)如下所示?

数据帧:

X__1
S003
S003
S003
S006
S006
S011
S007
S007
S003
S003
S005
S006
Run Code Online (Sandbox Code Playgroud)

进入:

$`1`
S003
S003
S003

$`2`
S006
S006

$`3`
S011

$`4`
S007
S007

$`5`
S003
S003

$`6`
S005

$`7`
S006
Run Code Online (Sandbox Code Playgroud)

我尝试使用:split(df, interaction(df$X__1))但是这将按照我的列表中的类别创建组,如下所示:

$`1`
S003
S003
S003
S003
S003

$`2`
S005

$`3`
S006
S006
S006

$`4`
S007
S007

$`6`
S011
Run Code Online (Sandbox Code Playgroud)

谢谢您的帮助 :)

r dataframe dplyr tidyr wrangle

1
推荐指数
1
解决办法
68
查看次数

标签 统计

r ×2

dataframe ×1

dplyr ×1

duplicates ×1

tidyr ×1

wrangle ×1