在R中的符号后提取文本

Question

在R中的符号后提取文本

Loo*_*per 10 regex r text-mining extraction

sample1 = read.csv("pirate.csv")
sample1[,7] 
[1] >>xyz>>hello>>mate 1
[2] >>xyz>>hello>>mate 2
[3] >>xyz>>mate 3
[4] >>xyz>>mate 4
[5] >>xyz>>hello>>mate 5
[6] >>xyz>>hello>>mate 6

Run Code Online (Sandbox Code Playgroud)

我必须提取并创建一个包含所有单词的数组>>.

这该怎么做？

另外,如何从以下字符串中提取不同变量中的(a)o qwerty,(b)mate1和(c)pirate1

p= '>>xyz- o qwerty>>hello>>mate1>>sole pirate1'

Run Code Online (Sandbox Code Playgroud)

谢谢

Answer 1

Sot*_*tos 13

x <- c('>>xyz>>hello>>mate 1', '>>xyz>>hello>>mate 2', '>>xyz>>mate 3', ' >>xyz>>mate 4' ,'>>xyz>>hello>>mate 5')
sub('.*>>', '', x)
#[1] "mate 1" "mate 2" "mate 3" "mate 4" "mate 5"

Run Code Online (Sandbox Code Playgroud)

Answer 2

Gop*_*ala 7

假设您已经将这些内容读入 R 数据框，您可以使用stringrpackage 如下：

library(stringr)
str_extract(df$mystring, '\\S+$')

Run Code Online (Sandbox Code Playgroud)

例如，如果您有这样的字符串：

s <- '>>hello1>>hola1>>ahoy mate1'

Run Code Online (Sandbox Code Playgroud)

你得到：

str_extract(s, '\\S+$')
[1] "mate1"

Run Code Online (Sandbox Code Playgroud)

是的。同意。我引导人们使用多功能的软件包，以便他们可以根据需要为不同的问题做更多的事情。 (2认同)

归档时间：	9 年，7 月前
查看次数：	10817 次
最近记录：	9 年，7 月前