我有一个数据帧,我想计算每组内的行数.我通常使用该aggregate函数对数据求和如下:
df2 <- aggregate(x ~ Year + Month, data = df1, sum)
Run Code Online (Sandbox Code Playgroud)
现在,我想计算观察结果,但似乎无法找到适当的论据FUN.直觉上,我认为它会如下:
df2 <- aggregate(x ~ Year + Month, data = df1, count)
Run Code Online (Sandbox Code Playgroud)
但是,没有这样的运气.
有任何想法吗?
一些玩具数据:
set.seed(2)
df1 <- data.frame(x = 1:20,
Year = sample(2012:2014, 20, replace = TRUE),
Month = sample(month.abb[1:3], 20, replace = TRUE))
Run Code Online (Sandbox Code Playgroud) 我在数据框中有两列
2010 1
2010 1
2010 2
2010 2
2010 3
2011 1
2011 2
Run Code Online (Sandbox Code Playgroud)
我想计算两列的频率并以此格式得到结果
y m Freq
2010 1 2
2010 2 2
2010 3 1
2011 1 1
2011 2 1
Run Code Online (Sandbox Code Playgroud) 我有以下数据集:
ClaimType ClaimDay ClaimCost dates month day
1 1 1 10811 1970-01-01 1 1970-01-01
2 1 1 18078 1970-01-01 1 1970-01-01
3 1 2 44579 1970-01-01 1 1970-01-02
4 1 3 23710 1970-01-01 1 1970-01-03
5 1 4 29580 1970-01-01 1 1970-01-04
6 1 4 36208 1970-01-01 1 1970-01-04
Run Code Online (Sandbox Code Playgroud)
我想创建一个新的数据集,其中包含"声明日"和"日期"列.索赔日应按每个值计算.所以例如,因为我们有两个,一个是两个,一个是三个,然后是两个四,我希望新的数据集如下:
ClaimDay day
2 1970-01-01
1 1970-01-02
1 1970-01-03
2 1970-01-04
Run Code Online (Sandbox Code Playgroud)
如您所见,Claimday和day是相关的.
我试过了
mydata <- aggregate(ClaimDay~Day,FUN=sum,data=mydata)$ClaimDay
Run Code Online (Sandbox Code Playgroud)
但问题是,在聚合时它会计算摘要.
任何人都可以帮我解决我的问题吗?