我有一个有5个变量和800行的数据框:
head(df)
V1 variable value element OtolithNum
1 24.9835 V7 130230.0 Mg 25
2 24.9835 V8 145844.0 Mg 25
3 24.9835 V9 126126.0 Mg 25
4 24.9835 V10 103152.0 Mg 25
5 24.9835 V11 129571.9 Mg 25
6 24.9835 V12 114214.0 Mg 25
Run Code Online (Sandbox Code Playgroud)
我需要执行以下操作:
我一直在使用dplyr包并使用以下代码按"element"变量进行分组,并提供平均值:
df1=df %>%
group_by(element) %>%
summarise_each(funs(mean), value)
Run Code Online (Sandbox Code Playgroud)
你可以帮我操作或添加上面的代码,以便在我提取平均值之前删除由"element"变量分组的异常值(上面定义为> 2 sd,从中间开始).
我从另一个帖子中尝试了以下代码(这就是为什么数据名称与我上面的个人数据不匹配),没有运气:
#standardize each column (we use it in the outdet function)
scale(dat)
#create function that looks for values > +/- 2 …
Run Code Online (Sandbox Code Playgroud)