我有一个数据框
Date Category Sum
0 2019-06-03 "25M" 34
1 2019-06-03 "25M" 60
2 2019-06-03 "50M" 23
3 2019-06-04 "25M" 67
4 2019-06-05 "50M" -90
5 2019-06-05 "50M" 100
6 2019-06-06 "100M" 6
7 2019-06-07 "25M" -100
8 2019-06-08 "100M" 67
9 2019-06-09 "25M" 450
10 2019-06-10 "50M" 600
11 2019-06-11 "25M" -9
12 2019-07-12 "50M" 45
13 2019-07-13 "50M" 67
14 2019-07-14 "100M" 130
15 2019-07-14 "50M" 45
16 2019-07-15 "100M" 100
17 2019-07-16 "25M" -90
18 2019-07-17 "25M" 700 …Run Code Online (Sandbox Code Playgroud) 我有一个数据框
df= data.frame(a=c(56,23,15,10),
b=c(43,NA,90.7,30.5),
c=c(12,7,10,2),
d=c(1,2,3,4),
e=c(NA,45,2,NA))
Run Code Online (Sandbox Code Playgroud)
我想从每行中选择两个随机的非 NA 行值,并将其余的转换为 NA
所需输出 - 由于随机性而有所不同
df= data.frame(
a=c(56,NA,15,NA),
b=c(43,NA,NA,NA),
c=c(NA,7,NA,2),
d=c(NA,NA,3,4),
e=c(NA,45,NA,NA))
Run Code Online (Sandbox Code Playgroud)
使用的代码
我知道从特定行中选择随机非 NA 值
set.seed(2)
sample(which(!is.na(df[1,])),2)
Run Code Online (Sandbox Code Playgroud)
但不知道如何应用所有数据框并获得所需的输出
我有一个数据集,它有一个名为“EntrySec”的变量,如果它落在某个范围内,我想替换这些值。
Entrysec
1
21
32
9
43
66
Run Code Online (Sandbox Code Playgroud)
期望:将所有值替换为
10 如果它落在 1-10 之间的范围内
20 如果它落在 11-20之间的范围内
30 如果它落在 21-30 之间的范围内等等
我有一个近 5000 列的数据框。这是数据框的片段
df= data.frame(a=c(13,17,19,7,9),
b=c(1,3,50,NA,3),
c=c(NA,NA,NA,NA,9))
Run Code Online (Sandbox Code Playgroud)
我想对数据框单元格的值进行排序
预期产出
df= data.frame(a=c(1,1,2,1,1),
b=c(2,2,1,NA,2),
c=c(NA,NA,NA,NA,1))
Run Code Online (Sandbox Code Playgroud) 给定一个包含字母和数字序列的字符串(例如):
"GHG-H89KKK90KKP"
Run Code Online (Sandbox Code Playgroud)
我们有没有办法把这个字符串分成两个列表,一个包含字母,一个包含数字?
["GHG-H", "KKK", "KKP"]
[89,90]
Run Code Online (Sandbox Code Playgroud) 我有很多列的巨大数据集,我想在新的 df max_df 中获得每个单元格的最大值
df1=data.frame(
aa=c(12,13,14,15,16,17,16,17,19),
bb=c(1,2,3,4,5,6,5,6,7))
df2=data.frame(
aa=c(NA,12,12,13,14,12,17,14,15),
bb=c(NA,2.5,3.5,2.5,3,4,5,6,7.5))
df3=data.frame(
aa=c(13,14,15,16,15,14,10,20,21),
bb=c(2,3,4,5,6,7,8,9,10))
Run Code Online (Sandbox Code Playgroud)
期望的输出
max_df=data.frame(aa=C(NA,14,15,16,16,17,17,20,21),
bb=c(NA,3,4,5,6,7,8,9,10))
Run Code Online (Sandbox Code Playgroud)
注意
代码必须给出所有可用列的最大值 [因此我们不能直接在我们的代码中使用 aa 和 bb]