小编Lio*_*nir的帖子

Compare every*nd symbol of a text string

the problem is I got large text file. Let it be

 a=c("atcgatcgatcgatcgatcgatcgatcgatcgatcg")
Run Code Online (Sandbox Code Playgroud)

我需要将此文本中的每个第3个符号与值(例如'c')进行比较,如果为true,我想添加1到计数器i.我想要使​​用,grep但似乎这个功能不符合我的目的.所以我需要你的帮助或建议.

更重要的是,我想从这个字符串中提取某些值到一个向量.例如,我想提取4:10符号,例如

 a=c("atcgatcgatcgatcgatcgatcgatcgatcgatcg")
[1] "gatcgatcga"
Run Code Online (Sandbox Code Playgroud)

先感谢您.

PS

我知道在R中编写我需要的脚本不是最好的主意,但我很好奇是否有可能以适当的方式编写脚本.

r

6
推荐指数
2
解决办法
107
查看次数

找到长度为n的所有可能的子串

我有一个有趣的(仅限我,也许,:))问题.我有这样的文字:

"abbba"
Run Code Online (Sandbox Code Playgroud)

问题是在此字符串中查找长度为n的所有可能的子字符串.例如,如果n = 2,子串是

'ab','bb','ba'
Run Code Online (Sandbox Code Playgroud)

如果n = 3,子串是

'abb','bbb','bba'
Run Code Online (Sandbox Code Playgroud)

我想用这样的东西:

x <- 'abbba'
m <- matrix(strsplit(x, '')[[1]], nrow=2)
apply(m, 2, paste, collapse='')
Run Code Online (Sandbox Code Playgroud)

但我得到了一个警告,它对len = 3不起作用.

r

5
推荐指数
2
解决办法
1089
查看次数

计算字符串包含子字符串时的出现次数

我有类似的字符串

'abbb'
Run Code Online (Sandbox Code Playgroud)

我需要了解有多少次我能找到子串'bb'.

grep('bb','abbb')
Run Code Online (Sandbox Code Playgroud)

回报1.因此,答案是2(a-bb和ab-bb).我怎样才能按照我需要的方式计算出现次数?

r

4
推荐指数
1
解决办法
1238
查看次数

标签 统计

r ×3