相关疑难解决方法(0)

删除"."之后的部分字符串.

我正在使用NCBI参考序列登录号,如变量a:

a <- c("NM_020506.1","NM_020519.1","NM_001030297.2","NM_010281.2","NM_011419.3", "NM_053155.2")  
Run Code Online (Sandbox Code Playgroud)

要获得从biomart包我需要删除的信息.1,.2登录号等设备中后.我通常使用以下代码执行此操作:

b <- sub("..*", "", a)

# [1] "" "" "" "" "" ""
Run Code Online (Sandbox Code Playgroud)

但正如您所看到的,这不是这个变量的正确方法.谁能帮我这个?

regex string r bioinformatics biomart

63
推荐指数
5
解决办法
9万
查看次数

删除R中列中字符后的所有内容

我需要删除列中问号后面的所有内容.

我有一个数据集EX:

my.data

BABY      MOM      LANDING
mark      dina     www.example.com/?kdvhzkajvkadjf
tom       becky    www.example.com/?ghkadkho[qeu
brad      tina     www.example.com/?klsdfngal;j
Run Code Online (Sandbox Code Playgroud)

我希望我的新数据是:

new.data

BABY      MOM      LANDING
mark      dina     www.example.com/?
tom       becky    www.example.com/?
brad      tina     www.example.com/?
Run Code Online (Sandbox Code Playgroud)

如何让R后,除去一切?my.data$LANDING

r character

7
推荐指数
1
解决办法
5936
查看次数

删除具有缺失值的数据框列中的字符串后的所有内容

我有一个类似于以下摘录的数据框:

Observation Identifier   Value
Obs001      ABC_2001     54
Obs002      ABC_2002     -2
Obs003                   1
Obs004                   1 
Obs005      Def_2001/05  
Run Code Online (Sandbox Code Playgroud)

我想将此数据帧转换为数据框,其中"_"符号后面的部分字符串将被删除:如下图所示:

Observation Identifier_NoTime   Value
Obs001      ABC                 54
Obs002      ABC                 -2
Obs003                          1
Obs004                          1 
Obs005      Def  
Run Code Online (Sandbox Code Playgroud)

我试图用试验strsplit,gsubsub为这里讨论,但不能强迫那些赞扬的工作.我必须说明以下事实:

  1. 列缺少值,我想将它们保留在原来的位置
  2. 字符串"_"位于变量的不同位置
  3. 我还希望保留数据框的其余部分

regex string r gsub strsplit

2
推荐指数
1
解决办法
4576
查看次数

标签 统计

r ×3

regex ×2

string ×2

bioinformatics ×1

biomart ×1

character ×1

gsub ×1

strsplit ×1