试图从R中的基因序列返回指定数量的字符

3 string split r substr

我的DNA序列如下: cgtcgctgtttgtcaaagtcg....

这可能是1000多个字母长.

但是,我只想查看字母5到200,例如,将字符串的这个子集定义为新对象.

我试着看看这个nchar功能,但还没找到能做到这一点的东西.

Art*_*ius 9

尝试

substr("cgtcgctgtttgtcaa[...]", 5, 200)
Run Code Online (Sandbox Code Playgroud)

请参阅substr().


Sha*_*ane 6

使用子字符串函数:

> tmp.string <- paste(LETTERS, collapse="")
> tmp.string <- substr(tmp.string, 4, 10)
> tmp.string
[1] "DEFGHIJ"
Run Code Online (Sandbox Code Playgroud)