我正在使用NCBI参考序列登录号,如变量a:
a <- c("NM_020506.1","NM_020519.1","NM_001030297.2","NM_010281.2","NM_011419.3", "NM_053155.2")
Run Code Online (Sandbox Code Playgroud)
要获得从biomart包我需要删除的信息.1,.2登录号等设备中后.我通常使用以下代码执行此操作:
b <- sub("..*", "", a)
# [1] "" "" "" "" "" ""
Run Code Online (Sandbox Code Playgroud)
但正如您所看到的,这不是这个变量的正确方法.谁能帮我这个?
我需要删除列中问号后面的所有内容.
我有一个数据集EX:
my.data
BABY MOM LANDING
mark dina www.example.com/?kdvhzkajvkadjf
tom becky www.example.com/?ghkadkho[qeu
brad tina www.example.com/?klsdfngal;j
Run Code Online (Sandbox Code Playgroud)
我希望我的新数据是:
new.data
BABY MOM LANDING
mark dina www.example.com/?
tom becky www.example.com/?
brad tina www.example.com/?
Run Code Online (Sandbox Code Playgroud)
如何让R后,除去一切?的my.data$LANDING?
我有一个类似于以下摘录的数据框:
Observation Identifier Value
Obs001 ABC_2001 54
Obs002 ABC_2002 -2
Obs003 1
Obs004 1
Obs005 Def_2001/05
Run Code Online (Sandbox Code Playgroud)
我想将此数据帧转换为数据框,其中"_"符号后面的部分字符串将被删除:如下图所示:
Observation Identifier_NoTime Value
Obs001 ABC 54
Obs002 ABC -2
Obs003 1
Obs004 1
Obs005 Def
Run Code Online (Sandbox Code Playgroud)
我试图用试验strsplit,gsub并sub为这里讨论,但不能强迫那些赞扬的工作.我必须说明以下事实: