如何从数据集中删除以大写字母开头的所有单词?
例如:
d <- c("nice", "cat", "Cat", "Dog")
Run Code Online (Sandbox Code Playgroud)
应该导致 c("nice", "cat")
(是的,在问这个问题之前,我在网上看了很长时间.我确定答案很简单,但我无法弄清楚它的正则表达式语法.)
我想使用 dplyr::mutate 用索引号替换唯一值。
我按几个不同的变量分组以访问我的数据帧的适当子集。
head(df)
group start_time end_time
1 group1 0 0.4
2 group1 0 0.4
3 group1 0 0.4
4 group1 0.4 0.8
5 group1 0.4 0.8
6 group2 0.0 0.4
7 group2 0.4 0.8
8 group2 0.8 1.02
Run Code Online (Sandbox Code Playgroud)
我 group_by 'group',然后按 'start_time'。有时一个给定的组只有一个 start_time,有时两个 start_time,有时三个。我需要为每个唯一的 start_time 创建一个新变量“idx”。但我想不出怎么做。
new_df <- df %>%
group_by(group, start_time) %>%
mutate(idx = row_number()) %>%
as.data.frame
Run Code Online (Sandbox Code Playgroud)
使用 row_number() 创建一个新变量是不对的。它给了我:
idx
1
2
3
1
2
1
1
1
Run Code Online (Sandbox Code Playgroud)
但我想要:
idx
1
1
1
2
2
1 …Run Code Online (Sandbox Code Playgroud) I have a vector of values:
values = c(22, 42, 243)
Run Code Online (Sandbox Code Playgroud)
I have a variable in a dataframe:
df$variable = 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 3
Run Code Online (Sandbox Code Playgroud)
如何在数据帧中的新变量中将值向量中的每个值重复n次,从而得到以下信息:
df$new_variable = 22, 22, 22, 22, 42, 42, 42, 42, 243, 243, 243, 243
Run Code Online (Sandbox Code Playgroud)