我已经通过将groupindex赋予aspxgridview中的特定列来对网格进行分组.
例如,如果我通过人名进行分组,并且当单击箭头以查看内容时,该特定人员制作的订单详细信息将包含在详细内容中.
当我点击标题字段进行排序时,它正在对groupContent内的数据进行排序,但它不用于排序groupsum的数据
除了人名之外,我将所有总计作为小组摘要的一部分显示.
例如,如果您在以下链接中看到:
https://demos.devexpress.com/ASPxGridViewDemos/Summary/GroupSortBySummary.aspx
如果按公司名称排序,则会对内容进行排序,但显示国家/地区和总和的摘要无法在外部排序.
请建议我选择解决这个问题.
谢谢.
这就是我想要做的.我的数据框有一个因子变量"country",我想根据国家/地区拆分数据框.然后,我想对每个国家/地区的数据框的每个变量采用列均值.
数据在这里:https://github.com/pourque/country-data
到目前为止我已经这样做了......
myList <- split(df1, df1$country)
for(i in 1:length(myList)) {
aggregate <- mapply(myList[[i]][,-c(38:39)], colMeans)
}
Run Code Online (Sandbox Code Playgroud)
(我不包括第38和第39列,因为这些是因素.)
我已经读过这个(多个列表中的函数),这让我觉得mapply就是这里的答案......但是我收到了这个错误:
Error in match.fun(FUN) :
'myList[[i]][, -c(38:39)]' is not a function, character or symbol
Run Code Online (Sandbox Code Playgroud)
也许我的格式不正确?
必须有一种R-ly方式wilcox.test使用group_by并行调用多个观察.我已经花了很多时间阅读这篇文章,但仍然无法弄清楚是否wilcox.test有这样的工作.下面的示例数据和代码,使用magrittr管道和summarize().
library(dplyr)
library(magrittr)
# create a data frame where x is the dependent variable, id1 is a category variable (here with five levels), and id2 is a binary category variable used for the two-sample wilcoxon test
df <- data.frame(x=abs(rnorm(50)),id1=rep(1:5,10), id2=rep(1:2,25))
# make sure piping and grouping are called correctly, with "sum" function as a well-behaving example function
df %>% group_by(id1) %>% summarise(s=sum(x))
df %>% group_by(id1,id2) %>% summarise(s=sum(x))
# make sure wilcox.test is …Run Code Online (Sandbox Code Playgroud) 我正在创建一堆基本状态报告,而我发现乏味的事情之一是向所有表添加总计行。我目前正在使用Tidyverse方法,这是我当前代码的一个示例。我正在寻找的是默认包含一些不同级别的选项。
#load into RStudio viewer (not required)
iris = iris
#summary at the group level
summary_grouped = iris %>%
group_by(Species) %>%
summarize(mean_s_length = mean(Sepal.Length),
max_s_width = max(Sepal.Width))
#summary at the overall level
summary_overall = iris %>%
summarize(mean_s_length = mean(Sepal.Length),
max_s_width = max(Sepal.Width)) %>%
mutate(Species = "Overall")
#append results for report
summary_table = rbind(summary_grouped, summary_overall)
Run Code Online (Sandbox Code Playgroud)
多次执行此操作非常繁琐。我有点想要:
summary_overall = iris %>%
group_by(Species, total = TRUE) %>%
summarize(mean_s_length = mean(Sepal.Length),
max_s_width = max(Sepal.Width))
Run Code Online (Sandbox Code Playgroud)
仅供参考-如果您熟悉SAS,我正在寻找可通过proc中的类,方法或类型语句使用的相同类型的功能,这意味着让我可以控制汇总级别并在一个调用中获得多个级别。
任何帮助表示赞赏。我知道我可以创建自己的函数,但希望已经存在一些东西。我也希望坚持使用整洁的编程风格,尽管我对此并不感兴趣。
我有一个这样的数据框:
Date Amount Category
1 02.07.15 1 1
2 02.07.15 2 1
3 02.07.15 3 1
4 02.07.15 4 2
5 03.07.15 5 2
6 04.07.15 6 3
7 05.07.15 7 3
8 06.07.15 8 3
9 07.07.15 9 4
10 08.07.15 10 5
11 09.07.15 11 6
12 10.07.15 12 4
13 11.07.15 13 4
14 12.07.15 14 5
15 13.07.15 15 5
16 14.07.15 16 6
17 15.07.15 17 6
18 16.07.15 18 5
19 17.07.15 19 4 …Run Code Online (Sandbox Code Playgroud) 我有兴趣找到一种有效的方式来获取包含以下内容的组表的摘要:
例如,在生成描述性统计信息的情况下,我使用以下代码:
data("mtcars")
require(dplyr)
mt_sum <- mtcars %>%
group_by(cyl) %>%
summarise_each(funs(min,max), hp, wt, disp)
Run Code Online (Sandbox Code Playgroud)
这会产生所需的输出:
> head(mt_sum)
Source: local data frame [3 x 7]
cyl hp_min wt_min disp_min hp_max wt_max disp_max
(dbl) (dbl) (dbl) (dbl) (dbl) (dbl) (dbl)
1 4 52 1.513 71.1 113 3.190 146.7
2 6 105 2.620 145.0 175 3.460 258.0
3 8 150 3.170 275.8 335 5.424 472.0
Run Code Online (Sandbox Code Playgroud)
我有兴趣用数字来丰富数据,这个数字可以反映每个组的值计数.关于计数,这可以简单地完成:
mt_sum2 <- mtcars %>%
group_by(cyl) %>%
summarise(countObs = n())
Run Code Online (Sandbox Code Playgroud)
这将生成所需的数据:
> …Run Code Online (Sandbox Code Playgroud) 我想总结data.table中的几个变量,宽格式输出,输出可能作为每个变量的列表.由于其他几种方法都不起作用,我试图做一个外部的lapply,给出变量的名称作为字符向量.我希望使用= FALSE传递这些内容.
carsx=as.data.table(cars)
lapply( list(speed="speed",dist= "dist"), #error object 'ansvals' not found
function(x) carsx[,list(mean(x), min(x), max(x) ), with=FALSE ] )
Run Code Online (Sandbox Code Playgroud)
由于这不起作用,我尝试了更简单的方法,没有lapply.
carsx[,list(mean("speed"), min("speed"), max("speed") ), with=FALSE ] #error object 'ansvals' not found
Run Code Online (Sandbox Code Playgroud)
这也不起作用.有没有办法做这样的事情?这种'与'的行为是否需要?(我知道?data.table只提到选择列,但在我的情况下,能够转换它们也很有用)
当= = FALSE时,j是要选择的名称或位置的向量,类似于data.frame.with = FALSE在data.table中通常很有用,可以动态选择列.
编辑我的目的是针对不同的变量以宽格式获取每组的摘要.我尝试扩展以下内容,它仅适用于一个变量,用于变量列表.
carsx[,list(mean(speed), min(speed), max(speed) ) ,by=(dist>50)
Run Code Online (Sandbox Code Playgroud)
可悲的是SO不允许我发布我的另一个问题.我在那里描述了我想要一个类似的输出:
lapply( list(speed="speed",dist= "dist"),
function(x) do.call("as.data.frame", aggregate(cars[,x], list(class=cars$dist>50), FUN=summary) ) )
Run Code Online (Sandbox Code Playgroud)
预期输出将是这样的:
$speed
V1 V2 V3
1: FALSE 12.96970 4 20
2: TRUE 20.11765 14 25
$dist
V1 V2 V3
1: FALSE 12.96970 4 20 …Run Code Online (Sandbox Code Playgroud) 我想知道是否有办法根据向量中的位置提取一个值,所以例如我有一个带有两个向量的数据框,我将它们从原始的V1和V2分组,就像一个ORDER在SQL中的BY.当我尝试按V1组类型获得第3分钟时出现问题.
有序数据框......
V1 V2
Ford 18
Ford 16
Ford 15
Ford 14
Ford 12
**Ford 5**
Ford 2
Ford 1
Nisan 10
Nisan 9
Nisan 8
Nisan 7
Nisan 6
**Nisan 5**
Nisan 4
Nisan 3
Toyota 20
Toyota 19
Toyota 15
Toyota 12
Toyota 11
**Toyota 10**
Toyota 6
Toyota 2
Run Code Online (Sandbox Code Playgroud)
结果我想在新数据框中,每个变量的第3分钟值...
V1 V2
Ford 5
Nisan 5
Toyota 10
Run Code Online (Sandbox Code Playgroud)
提前致谢.
我有一张看起来像这样的表:
start_table <- data.frame("Water_Year" = c("1903", "1903", "1904", "1904"), "X" = c(13, 11, 12,
15), "Day" = c(1, 2, 1, 2))
Run Code Online (Sandbox Code Playgroud)
('Day' 列不参与我的偏斜和峰度计算,它只是在我的表中)
我想要一个计算按年份分组的偏斜和峰度值的表格:
end_table <- data.frame("Water_Year" = c("1903", "1904"), "Skew" = c("skew_number_here",
"skew_number_here"), "Kurtosis" = c("kurtosis_number_here", "kurtosis_number_here"))
Run Code Online (Sandbox Code Playgroud)
我无法弄清楚如何按年份对其进行分组以执行这些计算。
我正在尝试制作一个表格,显示N(观察次数)、百分比频率(答案 > 0)以及百分比频率的上下置信区间,我想按类型对其进行分组。
数据示例
dat <- data.frame(
"type" = c("B","B","A","B","A","A","B","A","A","B","A","A","A","B","B","B"),
"num" = c(3,0,0,9,6,0,4,1,1,5,6,1,3,0,0,0)
)
Run Code Online (Sandbox Code Playgroud)
预期输出(已填充值):
Type N Percent Lower 95% CI Upper 95% CI
A
B
Run Code Online (Sandbox Code Playgroud)
试图
library(dplyr)
library(qwraps2)
table<-dat %>%
group_by(type) %>%
summarise(N=n(),
mean.ci = mean_ci(dat$num),
"Percent"=n_perc(num > 0))
Run Code Online (Sandbox Code Playgroud)
这有助于获得 N 和百分比频率,但在我添加 mean_ci 时返回错误:“列的长度必须为 1(汇总值),而不是 3”
我试过的第二个代码,在这里找到:
table2<-dat %>%
group_by(type) %>%
summarise(N.num=n(),
mean.num = mean(dat$num),
sd.num = sd(dat$num),
"Percent"=n_perc(num > 0)) %>%
mutate(se.num = sd.num / sqrt(N.num),
lower.ci = 100*(mean.num - qt(1 - (0.05 …Run Code Online (Sandbox Code Playgroud) group-summaries ×10
r ×9
dplyr ×5
aggregate ×3
dataframe ×2
aspxgridview ×1
data.table ×1
devexpress ×1
group-by ×1
kurtosis ×1
lapply ×1
list ×1
magrittr ×1
nested ×1
qwraps2 ×1
skew ×1
sorting ×1
summarize ×1
tidyverse ×1