小编Ste*_*man的帖子

使用grep帮助R中的数据框子集

我无法对数据进行子集化.我希望在x列上对数据进行子集化,其中前3个字符开始为G45.

我的数据框:

 x <- c("G448", "G459", "G479", "G406")  
 y <- c(1:4)
 My.Data <- data.frame (x,y)
Run Code Online (Sandbox Code Playgroud)

我试过了:

 subset (My.Data, x=="G45*")
Run Code Online (Sandbox Code Playgroud)

但我不确定如何使用通配符.我也尝试过grep()来查找指标:

 grep  ("G45*", My.Data$x)
Run Code Online (Sandbox Code Playgroud)

但它返回所有4行,而不仅仅是那些以G45开头的行,可能还因为我不确定如何使用通配符.

grep r subset dataframe

30
推荐指数
1
解决办法
9万
查看次数

!R中的grep - 查找不匹配的项目

我想在数据框中找到与模式不匹配的行.

 Key = c(1,2,3,4,5)
 Code = c("X348","I605","B777","I609","F123")
 df1 <- data.frame(Key, Code)
Run Code Online (Sandbox Code Playgroud)

我可以使用以下方法找到以I60开头的项目:

 df2 <- subset (df1, grepl("^I60", df1$Code))
Run Code Online (Sandbox Code Playgroud)

但我希望能够找到所有其他行(即那些不以I60开头的行).invert参数不适用于grepl.grep本身没有找到所有行,也不能将结果传递给subset命令.感谢帮助.

r

10
推荐指数
1
解决办法
2万
查看次数

在R中需要满足两个条件时计算平均值

我正在尝试从我的数据框中获取具有各种健康状况的男性和女性的平均年龄。

AgeAnalyisi$Age     num
AgeAnalyisi$Gout        logical
AgeAnalyisi$Arthritis   logical
AgeAnalyisi$Vasculitis  logical
etc
AgeAnalysis$Gender      Factor w/ 2 levels
Run Code Online (Sandbox Code Playgroud)

我可以分别使用

mean(AgeAnalysis$Age [AgeAnalysis$Gender=="M" & AgeAnalysis$Gout=="TRUE"] , na.rm = TRUE)
Run Code Online (Sandbox Code Playgroud)

但是有一种更雄辩的方法可以将所有数据汇总到一张表中,从而将平均年龄的输出表示为

          Male  Female
Gout        x   x
Arthritis   x   x
Vasculitis  x   x
etc         x   x
Run Code Online (Sandbox Code Playgroud)

谢谢

r

4
推荐指数
1
解决办法
5054
查看次数

具有4个等级的因子False,FALSE,True,TRUE但仅需要2个等级

我将数据框中的列设置为具有4个级别的因子

False, FALSE, True, TRUE
Run Code Online (Sandbox Code Playgroud)

我需要降低到2级

FALSE, TRUE
Run Code Online (Sandbox Code Playgroud)

我做了这个(工作正常)但是有更好的方法:

df$col1 <- as.character(df$col1)    # change the factor to chr
df$col1 <- toupper (df$col1)        # Ensure all are uppercase
df$col1 <- as.factor(df$col1)       # change back
Run Code Online (Sandbox Code Playgroud)

r

2
推荐指数
1
解决办法
161
查看次数

ggplot 中三个时间点的箱线图

我想要在同一图上包含数据中所有三个时间点的箱线图

数据:

df<-
structure(list(ID = c("ED_001", "ED_002", "ED_003", "ED_004", 
"ED_005"), Color = c("Black", "White", "Black", "Black", "White"
), Data_t1 = c(150, 159, 160, 154, 187), Data_t2 = c(123, 124, 
125, 126, 140), Data_t3 = c(133, 135, 145, 150, 153)), class = c("spec_tbl_df", 
"tbl_df", "tbl", "data.frame"), row.names = c(NA, -5L), spec = structure(list(
    cols = list(ID = structure(list(), class = c("collector_character", 
    "collector")), Color = structure(list(), class = c("collector_character", 
    "collector")), Data_t1 = structure(list(), class = c("collector_double", 
    "collector")), Data_t2 = structure(list(), class = …
Run Code Online (Sandbox Code Playgroud)

r ggplot2 dplyr

2
推荐指数
1
解决办法
590
查看次数

标签 统计

r ×5

dataframe ×1

dplyr ×1

ggplot2 ×1

grep ×1

subset ×1