相关疑难解决方法(0)

如何计算R中每行的字符串频率

我有一个.txt文件,看起来像这样:

rs1 NC AB NC     
rs2 AB NC AA  
rs3 NC NC NC  
...  
Run Code Online (Sandbox Code Playgroud)

对于每一行,我想计算"NC"的频率,以便我的输出如下所示:

rs1 2  
rs2 1  
rs3 3  
...
Run Code Online (Sandbox Code Playgroud)

有人能告诉我如何在R或Linux中执行此操作吗?非常感谢!

r frequency count

4
推荐指数
2
解决办法
2400
查看次数

计算数据框多列中字符串的出现次数

我有以下数据框,我想为每一行计算单词“High”的出现次数,并将“countHigh”作为另一列附加到数据框

     a    b    c
1 High High High
2 High  Low High
3  Low  Low High
Run Code Online (Sandbox Code Playgroud)

所以我应该得到一个计数向量(3,2,1)。

我试过 apply() 和 stringr:str_count 如下:

> apply(test.df[,1:3],1,str_count,"High" )

    [,1] [,2] [,3]
[1,]    1    1    0
[2,]    1    0    0
[3,]    1    1    1
Run Code Online (Sandbox Code Playgroud)

我两次使用了 apply() 函数:

> apply(apply(test.df[,1:3],1,str_count,"High" ),2,sum)
[1] 3 2 1
Run Code Online (Sandbox Code Playgroud)

有没有更好的方法来做到这一点,特别是只使用一次 apply() 并使用 grep() 或 which() ?

谢谢

r

1
推荐指数
1
解决办法
1904
查看次数

标签 统计

r ×2

count ×1

frequency ×1