如何使用 dplyrs 连接函数在 R 中通过 OR 语句连接 2 个表?
例如,使用键将 df1 加入 df2:df1_ColumnA == df2_ColumnA 或 df1_ColumnA == df2_ColumnB?
library(dplyr)
df1 = data.frame(V1 = c('A', 'B', 'C','D'), v2 = c(1,2,3,4))
df2 = data.frame(VA = c('A', 'B', 'C'), VB = c('D', 'E', 'F'), vC = c(4,5,6))
## Join on column 1
df3 = df1 %>% left_join(df2, by = c('V1' = 'VA'))
## join on column 1 AND column 2
df4 = df1 %>% left_join(df2, by = c('V1' = 'VA', 'V1' = …Run Code Online (Sandbox Code Playgroud) 我的问题非常类似于
除了,我需要密度图,并且我希望将 y 轴作为每 1000 名患者的 x 计数之类的比率。
我有多组不同大小的数据,我希望每个比例都与其组大小有关,而不是总大小。
为了更清楚,假设我在一个数据框中有两组数据
示例数据:
dataA<-rnorm(10000,3,sd=2)
dataB<-rnorm(40000,5,sd=3)
bp_combi<-data.frame(dataset=c(rep('A',length(dataA)),rep('B',length(dataB))),
value=c(dataA,dataB))
Run Code Online (Sandbox Code Playgroud)
我可以将分布相对于总大小绘制在一起,但不能相对于相对大小绘制。
combi_dens = ggplot(bp_combi,
aes(x=value,
number_of_cases=nrow(bp_combi),
y=(..count..)/number_of_cases*1000, fill=dataset)) +
geom_density(bw = 1, alpha=0.4, size = 1.5 )
Run Code Online (Sandbox Code Playgroud)
是否有可能相对于每个组的大小?
谢谢!
我正在尝试绘制带有填充和 NA 值的线图。Plotly 自动用 NA 值填充我希望其为空的部分。获得正确图表的最佳方法是什么?
不能将 NA 值设置为 0。我也在使用胡佛,并且不希望将鼠标悬停在线上时得到 0 的结果。
R 数据+代码示例:
library(plotly)
set.seed(1)
A = data.frame(x = 1900:2000, value=cumsum(rnorm(101)))
A[40:70, 2:3] = NA
fig <- plot_ly(x = A$x, y = A$value, type = 'scatter', mode = 'lines', fill = 'tozeroy')
fig
Run Code Online (Sandbox Code Playgroud)
我正在使用R将字符向量列表转换为数据框。如何将列表索引也转换为数据框?
list1 = list(c('kip','kroket'),'ei','koe')
print(list1)
##[[1]]
##[1] "kip" "kroket"
##[[2]]
##[1] "ei"
##[[3]]
##[1] "koe"
df = data.frame(col1 = unlist(x))
print(df)
## col1
##1 kip
##2 kroket
##3 ei
##4 koe
Run Code Online (Sandbox Code Playgroud)
首选输出如下所示:
## col1 col2
##1 kip 1
##2 kroket 1
##3 ei 2
##4 koe 3
Run Code Online (Sandbox Code Playgroud)