所以我有一张地图正在绘制加泰罗尼亚的气压:
这是一个特写:
我现在想要选择气压高于97 kPa(深蓝色)的所有观测值,并创建一个新的数据框用于进一步分析.这是棘手的一点,我想选择符合高度过滤器AAAAND的观测沿着地中海沿岸.大多数97 kPa以上的观测位于地中海沿岸,但有一些异常值位于内陆.
最后,我想某种对角线纬度,经度过滤必须发生,但我不知道如何指定它.是否有某种方式来绘制,或在数据上绘制多边形然后让它选择内部的所有内容?
这是我的数据:
structure(list(final.Latitude = c(42.161626, 41.516819, 41.786856,
41.748215, 42.393932, 41.767667, 41.938401, 41.494079, 41.752819,
41.422327, 41.253914, 42.104854, 40.544337, 41.647625, 41.26267,
40.745573, 40.881084, 41.201499, 41.494183, 40.873663, 41.211076,
41.814818, 41.737032, 42.434746, 41.796036, 41.197585, 42.119308,
41.665698, 41.141899, 40.883885, 40.814408, 40.710754, 41.65649,
41.541525, 41.581905, 41.61424, 42.215454, 41.137955, 41.553355,
42.17195, 40.909931, 42.757417, 41.89469, 41.49472, 41.447145,
41.791172, 41.862813, 41.677615, 41.398371, 41.094337, 42.83454,
41.331905, 41.954854, 41.560246, 41.758456, 41.516953, 41.625954,
40.974225, 42.098215, 42.238615, 41.841862, 41.280658, 41.491805,
41.675766, 42.416667, 41.220308, 42.043361, 41.009161, 41.136268,
41.747716, 41.816881, …Run Code Online (Sandbox Code Playgroud) 目标:按降序绘制前 20 个国家/地区
问题:在使用该top_n功能时,它坚持选择全部而不是前20个。
这是我的代码:
#Omit missing values
na.omit(kiva_loans)%>%
#Group by country label
group_by(country_code)%>%
dplyr::count(country_code, sort = TRUE)%>%
top_n(20)%>%
ggplot(aes(reorder(x=country_code,n),y=n))+
geom_col(position="dodge",
color = "black",
fill="purple")+
coord_flip()
Run Code Online (Sandbox Code Playgroud)
在该top_n(20)行之后,输出为:
这表明它并没有在 20 处切断它。这又是一个可怕的情节:
好的,所以我在这里阅读了很多帖子,我有点尴尬因为我认为我理解了基本的dplyr功能.
我不能group_by组成团体,我感到困惑.
我有数据框test.我想要的只是按变量分组ID,然后计算每组两个变量之间的相关性.
我不知道发生了什么,因为它没有分组,只有当我应该有127组和127个相关时才输出1个相关性.为什么?
什么test样子:
我写的:
library(dplyr)
library(magrittr)
test%>%
mutate(ID=as.character(ID))%>%
group_by(ID)%$%
cor(sulfate,nitrate,use="complete.obs")
Run Code Online (Sandbox Code Playgroud)
我得到了什么:[1] 0.0568084.