R,在第n次出现之前的所有内容的正则表达式

Question

s <- "1-343-43Hello_2_323.14_fdh-99H"

在RI中想要使用正则表达式来获取子串,比如说第二个下划线.如何使用一个正则表达式完成这项工作？另一种方法是用'_'分割然后粘贴前两个 - 一些东西;

paste(sapply(strsplit(s, "_"),"[", 1:2), collapse = "_")

得到:

[1] "1-343-43Hello_2"

但是我如何制作正则表达式来做同样的事情呢？

Answer 1

一般来说,对于回答标题中的问题,是

sub("^(([^_]*_){n}[^_]*).*", "\\1", s)

您允许n的数量在哪里_.

Answer 2

您可以使用sub：

sub("^([^_]*_[^_]*).*", "\\1", s)

s <- "1-343-43Hello_2_323.14_fdh-99H"
sub("^([^_]*_[^_]*).*", "\\1", s)
## => [1] "1-343-43Hello_2"

图案详情：

替换\\1仅返回组 1 内的值。