查找以某个字母开头的所有单词

pun*_*ess 3 regex string r

我在R和正则表达式中都非常生疏.我试过阅读R的正则表达式帮助文件,但它根本没有帮助!

我有一个包含3列的数据框:

  1. 词汇表,即在语料库中找到的500个最常见单词的列表
  2. 计数,单词出现的时间,以及
  3. 概率,计数除以所有字数的总和

列表从最常见到最不常见排列,因此不按字母顺序排列.

我需要为所有以相同字母开头的单词拉出整行.(我不需要循环遍历所有字母表,我只需要一个字母的结果.)

我不只是询问正则表达式,而是如何在R中编写它,所以我将结果放在一个新的数据帧中.

jub*_*uba 5

你可以使用grep:

df <- data.frame(words=c("apple","orange","coconut","apricot"),var=1:4)
df[grep("^a", df$words),]
Run Code Online (Sandbox Code Playgroud)

哪个会给:

    words var
1   apple   1
4 apricot   4
Run Code Online (Sandbox Code Playgroud)