小编use*_*218的帖子

如何在for循环中的数据框架中创建变量?

我有一个R数据框mydata,用一定年龄和一定高度的人数来调用.所以数据帧我有变量mydata$ageto10(=人长达十几年的年龄数),mydata$ageto20(=人长达二十岁时数目),等等与年龄35,42和65也是一样高度(以及其他几个变量).

我想创造出指人的年龄范围内10to25的数量,年龄范围25to35,35to42和42to65的计数新的变量.所以对于第一种情况,我想做:

mydata$age10to25 <- mydata$ageto25 - mydata$ageto10
Run Code Online (Sandbox Code Playgroud)

这有效,但我希望在所有范围内执行此操作,并对高度和其他变量执行相同操作.必须有一种比复制粘贴40次并手动更改变量名更简单的方法!:)

我认为它应该是这样的:

for (i in c("age", "height"))
{
  for (k in c(10,20,35,42, 65))
  {
  assign(paste("mydata$", i, k, "to", <<next k here>>, sep=""), get(paste("mydata$", i, <<next k here>>, , sep="")) - get(paste("mydata$", i, k, , sep=""))
  }
}
Run Code Online (Sandbox Code Playgroud)

但显然,这并不工作(即使我在K手工填写的,似乎assign命令并不意味着当前的数据分配变量名.

最好的方法是什么?

variables for-loop r

4
推荐指数
1
解决办法
1670
查看次数

在R中随机选择组(以及每组的所有情况)?

我有一个带有两级数据的R数据帧:idyear.在由定义的组内id,年份增加(整个数据集每组具有相同(数量)年,如下所示:

id    year    var1    var2
11A   2001    ...     ...
11A   2002    ...     ...
11A   2003    ...     ...
11A   2004    ...     ...
13B   2001    ...     ...
13B   2002    ...     ...
13B   2003    ...     ...
13B   2004    ...     ...
22Z   2001    ...     ...
Run Code Online (Sandbox Code Playgroud)

在我的数据中,我有大约20,000个组,这些组的数量太多,无法制作出很好的增长曲线图.如何随机选择约20个我的身份证?(所以:还要选择与该id对应的所有4行年份?)

r sample

2
推荐指数
1
解决办法
3098
查看次数

标签 统计

r ×2

for-loop ×1

sample ×1

variables ×1