grep
在R问题中,我有一个非常愚蠢的东西.道歉,因为这看起来应该很容易 - 我显然只是遗漏了一些东西.
我有一个字符串向量,让我们称之为alice
.部分alice
内容打印在下面:
T.8EFF.SP.OT1.D5.VSVOVA#4
T.8EFF.SP.OT1.D6.LISOVA#1
T.8EFF.SP.OT1.D6.LISOVA#2
T.8EFF.SP.OT1.D6.LISOVA#3
T.8EFF.SP.OT1.D6.VSVOVA#4
T.8EFF.SP.OT1.D8.VSVOVA#3
T.8EFF.SP.OT1.D8.VSVOVA#4
T.8MEM.SP#1
T.8MEM.SP#3
T.8MEM.SP.OT1.D106.VSVOVA#2
T.8MEM.SP.OT1.D45.LISOVA#1
T.8MEM.SP.OT1.D45.LISOVA#3
Run Code Online (Sandbox Code Playgroud)
我想grep给出我在其中一些字符串中出现的D之后的数字,条件是包含"LIS"的字符串和空字符串或其他东西.
我希望grep能够返回捕获组的值,而不是整个字符串.这是我的R风格的正则表达式:
pattern <- (?<=\\.D)([0-9]+)(?=.LIS)
Run Code Online (Sandbox Code Playgroud)
没什么太复杂的.但是为了得到我所追求的东西,而不是仅仅使用grep(pattern, alice, value = TRUE, perl = TRUE)
我正在做的事情,这似乎很糟糕:
reg.out <- regexpr(
"(?<=\\.D)[0-9]+(?=.LIS)",
alice,
perl=TRUE
)
substr(alice,reg.out,reg.out + attr(reg.out,"match.length")-1)
Run Code Online (Sandbox Code Playgroud)
现在看它看起来似乎并不太难看,但是为了让这件完全无关紧要的工作变得麻烦,令人尴尬.任何关于如何妥善解决这个问题的指针?
加分指着我解释之间无论我访问的不同网页$
,@
和attr
.
had*_*ley 53
尝试使用stringr包:
library(stringr)
str_match(alice, ".*\\.D([0-9]+)\\.LIS.*")[, 2]
Run Code Online (Sandbox Code Playgroud)
Ken*_*ams 37
你可以这样做:
pat <- ".*\\.D([0-9]+)\\.LIS.*"
sub(pat, "\\1", alice)
Run Code Online (Sandbox Code Playgroud)
如果您只想要alice
模式匹配的子集,请尝试以下方法:
pat <- ".*\\.D([0-9]+)\\.LIS.*"
sub(pat, "\\1", alice[grepl(pat, alice)])
Run Code Online (Sandbox Code Playgroud)
归档时间: |
|
查看次数: |
38254 次 |
最近记录: |