小编h09*_*349的帖子

将具有相同单词但顺序不同的字符串分组

我有一个从两个或三个不同字段创建的示例串联文本字段(请参阅下面的示例数据),但是不能保证单词的顺序相同。我想创建一个新的数据集,其中具有相同单词的字段(无论顺序如何)都会折叠。但是,由于我事先不知道哪些单词将连接在一起,因此代码必须识别两个字符串中的所有单词都匹配。

示例数据代码:

var1<-c("BLUE|RED","RED|BLUE","WHITE|BLACK|ORANGE","BLACK|WHITE|ORANGE")
freq<-c(1,1,1,1)
have<-as.data.frame(cbind(var1,freq))

Run Code Online (Sandbox Code Playgroud)

有:

var1                 freq
BLUE|RED              1
RED|BLUE              1
WHITE|BLACK|ORANGE    1
BLACK|WHITE|ORANGE    1
Run Code Online (Sandbox Code Playgroud)

我怎样才能将数据折叠成我想要的下面?

color               freq
BLUE|RED              2
WHITE|BLACK|ORANGE    2
Run Code Online (Sandbox Code Playgroud)

string grouping r

1
推荐指数
1
解决办法
275
查看次数

标签 统计

grouping ×1

r ×1

string ×1