the problem is I got large text file. Let it be
a=c("atcgatcgatcgatcgatcgatcgatcgatcgatcg")
Run Code Online (Sandbox Code Playgroud)
我需要将此文本中的每个第3个符号与值(例如'c')进行比较,如果为true,我想添加1到计数器i.我想要使用,grep但似乎这个功能不符合我的目的.所以我需要你的帮助或建议.
更重要的是,我想从这个字符串中提取某些值到一个向量.例如,我想提取4:10符号,例如
a=c("atcgatcgatcgatcgatcgatcgatcgatcgatcg")
[1] "gatcgatcga"
Run Code Online (Sandbox Code Playgroud)
先感谢您.
PS
我知道在R中编写我需要的脚本不是最好的主意,但我很好奇是否有可能以适当的方式编写脚本.
我有一个有趣的(仅限我,也许,:))问题.我有这样的文字:
"abbba"
Run Code Online (Sandbox Code Playgroud)
问题是在此字符串中查找长度为n的所有可能的子字符串.例如,如果n = 2,子串是
'ab','bb','ba'
Run Code Online (Sandbox Code Playgroud)
如果n = 3,子串是
'abb','bbb','bba'
Run Code Online (Sandbox Code Playgroud)
我想用这样的东西:
x <- 'abbba'
m <- matrix(strsplit(x, '')[[1]], nrow=2)
apply(m, 2, paste, collapse='')
Run Code Online (Sandbox Code Playgroud)
但我得到了一个警告,它对len = 3不起作用.
我有类似的字符串
'abbb'
Run Code Online (Sandbox Code Playgroud)
我需要了解有多少次我能找到子串'bb'.
grep('bb','abbb')
Run Code Online (Sandbox Code Playgroud)
回报1.因此,答案是2(a-bb和ab-bb).我怎样才能按照我需要的方式计算出现次数?
r ×3