相关疑难解决方法(0)

df <- structure(list(X2 = c("BB_137.HVMSC", "BB_138.combined.HVMSC", 
"BB_139.combined.HVMSC", "BB_140.combined.HVMSC", "BB_141.HVMSC", 
"BB_142.combined.HMSC-bm")), .Names = "X2", row.names = c(NA, 
-6L), class = c("tbl_df", "tbl", "data.frame"))

Run Code Online (Sandbox Code Playgroud)

看起来像这样

> df
# A tibble: 6 x 1
                       X2
                    <chr>
1            BB_137.HVMSC
2   BB_138.combined.HVMSC
3   BB_139.combined.HVMSC
4   BB_140.combined.HVMSC
5            BB_141.HVMSC
6 BB_142.combined.HMSC-bm

Run Code Online (Sandbox Code Playgroud)

我想要做的是.将最后一个字段保留为第二列,分成两列(作为分隔符)

              col1 col2
            BB_137 HVMSC
   BB_138.combined HVMSC
   BB_139.combined HVMSC
   BB_140.combined HVMSC
            BB_141 HVMSC
   BB_142.combined HMSC-bm

Run Code Online (Sandbox Code Playgroud)

什么是正确的方法呢？

我的尝试是这样的:

> df %>% separate(X2, into = c("sid","status", "tiss"), sep = "[.]") 
# A tibble: 6 …

Run Code Online (Sandbox Code Playgroud)

regex r dplyr tidyverse

sca*_*der

2017 09-11

3
推荐指数

1
解决办法

789
查看次数

如何在最后一次出现子字符串之前获取字符串？

我想在给定子字符串的最后一次出现之前获取字符串。

我的字符串是，

路径 = D:/me/vol101/Prod/cent/2019_04_23_01/image/AVEN_000_3400_img_pic_p1001-1010/pxy/AVEN_000_3400_img-mp4_to_MOV_v1001-1010.mov

我的子串，1001-1010会出现两次。我想要的只是在最后一次出现之前获取字符串。

注意：我的子字符串是动态的，填充不同，但只有数字。

我想要，

D:/me/vol101/Prod/cent/2019_04_23_01/image/AVEN_000_3400_img_pic_p1001-1010/pxy/AVEN_000_3400_img-mp4_to_MOV_v

我已经使用正则表达式和切片，

>>> p = 'D:/me/vol101/Prod/cent/2019_04_23_01/image/AVEN_000_3400_img_pic_p1001-1010/pxy/AVEN_000_3400_img-mp4_to_MOV_v1001-1010.mov'
>>> q = re.findall("\d*-\d*",p)
>>> q[-1].join(p.split(q[-1])[:-1])
'D:/me/vol101/Prod/cent/2019_04_23_01/image/AVEN_000_3400_img_pic_p1001-1010/pxy/AVEN_000_3400_img-mp4_to_MOV_v'
>>>

Run Code Online (Sandbox Code Playgroud)

纯粹使用正则表达式有什么更好的方法吗？

请注意我已经尝试了很多，例如：

我通过使用正则表达式和切片得到了答案，但我想通过单独使用正则表达式来实现..

python regex python-3.x

Moh*_*med

2019 04-25

3
推荐指数

2
解决办法

1136
查看次数