小编Met*_*ics的帖子

R中的Hausman型式试验

我一直在使用R的 " plm "包来进行面板数据的分析.在这个包中用于在"固定效应"或"随机效应"模型之间进行选择的重要测试之一称为Hausman类型.Stata也可以进行类似的测试.这里的要点是Stata要求首先估计固定效应,然后是随机效应.但是,我没有在"plm"包中看到任何这样的限制.所以,我想知道" plm "包是否首先具有默认的"固定效果",然后是"随机效应"第二.供您参考,我在下面提到了Stata和R中我为分析所遵循的步骤.

*

Stata Steps: (data=mydata, y=dependent variable,X1:X4: explanatory variables)
    *step 1 : Estimate the FE model
    xtreg y X1 X2 X3 X4 ,fe
    *step 2: store the estimator 
    est store fixed
    *step 3 : Estimate the RE model
    xtreg y X1 X2 X3 X4,re
   * step 4: store the estimator 
    est store random
    *step 5: run Hausman test
    hausman fixed random

#R steps (data=mydata, y=dependent variable,X1:X4: explanatory variables)
#step 1 …
Run Code Online (Sandbox Code Playgroud)

r stata panel-data plm

3
推荐指数
1
解决办法
1万
查看次数

总结R中k个变量的正值

我想首先找到max of 0 or jwhere j是任何变量,然后将这些变量与数据帧的k(k = 1,2,... k)变量相加data.在stata,我做了如下:

 gen sum=max(0,x)+max(0,y)+max(0,z)+...+max(0,k)
Run Code Online (Sandbox Code Playgroud)

R我使用以下方法:

data$sum<-ifelse(data$x<0,0,data$x*1)+ifelse(data$y<0,0,data$y*1)+ifelse(data$z<0,0,data$z*1)+...+ifelse(data$k<0,0,data$k*1)
Run Code Online (Sandbox Code Playgroud)

我想知道是否有另一种有效的方法R来做同样的事情.

r sum stata

3
推荐指数
1
解决办法
266
查看次数

条件if和编程如果在Stata中

我试图理解Stata中编程if和条件之间的区别if.这就是我在做的事情.

sysuse auto,clear

#conditional if 
sum price if price>4499


    Variable |       Obs        Mean    Std. Dev.       Min        Max
-------------+--------------------------------------------------------
       price |        48    7312.813    3102.784       4504      15906



# programming if 
if price>3291{
sum price
}


    Variable |       Obs        Mean    Std. Dev.       Min        Max
-------------+--------------------------------------------------------
       price |        74    6165.257    2949.496       3291      15906



# programming if
if price>5000{
sum price
}

This doesn't give me anything

#programming if 

if price>4000{
sum price}

    Variable |       Obs        Mean    Std. Dev.       Min        Max …
Run Code Online (Sandbox Code Playgroud)

if-statement conditional-statements stata

3
推荐指数
1
解决办法
1万
查看次数

ggplot2中的geom_density与基础R中的密度之间的差异

我在R中有一个数据如下:

  bag_id location_type            event_ts
2     155        sorter 2012-01-02 17:06:05
3     305       arrival 2012-01-01 07:20:16
1     155      transfer 2012-01-02 15:57:54
4     692       arrival 2012-03-29 09:47:52
10    748      transfer 2012-01-08 17:26:02
11    748        sorter 2012-01-08 17:30:02
12    993       arrival 2012-01-23 08:58:54
13   1019       arrival 2012-01-09 07:17:02
14   1019        sorter 2012-01-09 07:33:15
15   1154      transfer 2012-01-12 21:07:50
Run Code Online (Sandbox Code Playgroud)

class(event_ts)是哪里POSIXct.

我想在不同的时间找到每个位置的袋子密度.

我使用了命令geom_density(ggplot2),我可以很好地绘制它.我想知道density(base)和这个命令之间是否有任何区别.我的意思是他们正在使用的方法或他们正在使用的默认带宽等有任何区别.

我需要将密度添加到我的数据框中.如果我使用过该函数density(base),我知道如何使用该函数approxfun将这些值添加到我的数据框中,但是我想知道它在使用时是否相同geom_density(ggplot2).

r ggplot2 kernel-density density-plot

3
推荐指数
1
解决办法
2083
查看次数

使用glmulti()在穷举的全子集回归中可以使用的最大变量数是多少

我正在使用glmulti()R中的包来尝试对某些数据运行全子集回归.我有51个预测因子,最多观察到276个.我意识到详尽的遗传算法方法不能用这么多变量计算,因为我收到以下信息:

Warning message:
In glmulti(y = "Tons_N", data = MDatEB1_TonsN, level = 1, method = "h",  :
  !Too many predictors.
Run Code Online (Sandbox Code Playgroud)

有了这些类型的需求(即许多带有大量观察结果的变量),我可以在一次全子集回归中使用多少个?我正在研究变量消除技术,但我想在分析的这个阶段使用尽可能多的变量.也就是说,我想使用此分析的结果来做出可变消除决策.是否有另一个可以一次处理更多变量的包?

这是我正在使用的代码.不幸的是,由于与项目相关的机密性,我无法附加数据集.

TonsN_AllSubset <- glmulti(Tons_N ~ ., data = MDatEB1_TonsN, level = 1, method = "h",crit = "aic", confsetsize = 20, plotty = T, report = T,fitfunction = "glm")

我对这个软件包和一般的建模都比较陌生.任何方向或建议将不胜感激.谢谢!

r linear-regression glm

3
推荐指数
1
解决办法
5559
查看次数

如何使用R在GLM中指定负二项式误差分布?

我正在使用glm()R中的函数构建模型.假设我知道我的数据具有适合负二项分布的误差分布.

当我为各种家庭搜索R手册时,family=binomial作为选项提供,但negative binomial不是.

在R手册(系列)的同一部分中,NegBinomial链接在"另请参阅"部分,但它是在二项式系数的上下文中呈现的(我甚至不确定这是指什么).

总而言之,我希望找到与之类似的语法glm(y~x, family=negbinomial, data=d,na.omit).

r glm

3
推荐指数
1
解决办法
4271
查看次数

stata中的##是什么意思?

我遇到了包含###存在的stata代码.我用谷歌搜索但找不到.请告诉我这对stata意味着什么?

stata

2
推荐指数
1
解决办法
3485
查看次数

在R中设置线长

Google R样式指南建议每行最多80个字符。我想知道如何在中设置行长R。在stata此完成为:

set linesize 80
Run Code Online (Sandbox Code Playgroud)

r stata

2
推荐指数
1
解决办法
3442
查看次数

在perl中R"str"等价

如何在Perl中获取对象的数据结构?

我可以使用str轻松地在R中执行此操作

    str(data)
Run Code Online (Sandbox Code Playgroud)

我想知道Perl中是否有类似的.

string perl structure r

2
推荐指数
1
解决办法
109
查看次数

将列名与R中的列数据连接(使用data.table)

我有一个data.table如下,

library(data.table)

dt<-structure(list(varx = c(0L, 1L, 0L, 0L, 1L, 0L, 1L, 0L, 0L, 0L
), vary = c(0L, 0L, 0L, 0L, 1L, 0L, 1L, 0L, 0L, 0L)), class = c("data.table", 
"data.frame"), row.names = c(NA, -10L))
dt
    varx vary
 1:    0    0
 2:    1    0
 3:    0    0
 4:    0    0
 5:    1    1
 6:    0    0
 7:    1    1
 8:    0    0
 9:    0    0
10:    0    0
Run Code Online (Sandbox Code Playgroud)

我试图得到以下输出:

dt 
    varx    vary
1:  varx_n  vary_n
2:  varx_y  vary_n
3:  varx_n …
Run Code Online (Sandbox Code Playgroud)

r concatenation multiple-columns data.table

2
推荐指数
1
解决办法
80
查看次数