我有以下数据框:
>dados
COUNTRY Year CO2 emissions Pop. Growth(%)
Argentina 1994 1.23 0.3
Argentina 1995 1.26 0.2
Argentina 1996 1.28 0.4
Argentina 1997 1.24 0.2
Brazil 1994 1.54 0.7
Brazil 1995 1.59 0.6
Brazil 1996 1.60 0.9
Brazil 1997 1.58 1.3
Run Code Online (Sandbox Code Playgroud)
我想首先区分每个国家的变量CO2 emissions和。Pop. Growth(%)我已经尝试过该函数dados[,2:4] <- diff(dados[,2:4]),但它返回了错误:
“r[i1] - r[-length(r):-(length(r) - lag + 1L)] 中的错误:二元运算符的非数字参数”
我正在处理一个横截面数据集,它看起来像:
Id Year Age
1 2003 20
1 2003 20
1 2003 20
2 2003 35
2 2003 37
2 2003 42
3 2003 55
3 2003 55
3 2003 55
Run Code Online (Sandbox Code Playgroud)
为了减少我的样本中由于 Id 分配错误而导致的测量错误,我只需要保留具有相同年龄的个体,如果没有出现这种情况就会下降。
我正在寻找的输出是:
Id Year Age
1 2003 20
1 2003 20
1 2003 20
3 2003 55
3 2003 55
3 2003 55
Run Code Online (Sandbox Code Playgroud)
你有什么建议吗?