我一直在使用R的 " plm "包来进行面板数据的分析.在这个包中用于在"固定效应"或"随机效应"模型之间进行选择的重要测试之一称为Hausman类型.Stata也可以进行类似的测试.这里的要点是Stata要求首先估计固定效应,然后是随机效应.但是,我没有在"plm"包中看到任何这样的限制.所以,我想知道" plm "包是否首先具有默认的"固定效果",然后是"随机效应"第二.供您参考,我在下面提到了Stata和R中我为分析所遵循的步骤.
*
Stata Steps: (data=mydata, y=dependent variable,X1:X4: explanatory variables)
*step 1 : Estimate the FE model
xtreg y X1 X2 X3 X4 ,fe
*step 2: store the estimator
est store fixed
*step 3 : Estimate the RE model
xtreg y X1 X2 X3 X4,re
* step 4: store the estimator
est store random
*step 5: run Hausman test
hausman fixed random
#R steps (data=mydata, y=dependent variable,X1:X4: explanatory variables)
#step 1 …
Run Code Online (Sandbox Code Playgroud) 我想首先找到max of 0 or j
where j
是任何变量,然后将这些变量与数据帧的k(k = 1,2,... k)变量相加data
.在stata
,我做了如下:
gen sum=max(0,x)+max(0,y)+max(0,z)+...+max(0,k)
Run Code Online (Sandbox Code Playgroud)
在R
我使用以下方法:
data$sum<-ifelse(data$x<0,0,data$x*1)+ifelse(data$y<0,0,data$y*1)+ifelse(data$z<0,0,data$z*1)+...+ifelse(data$k<0,0,data$k*1)
Run Code Online (Sandbox Code Playgroud)
我想知道是否有另一种有效的方法R
来做同样的事情.
我试图理解Stata中编程if
和条件之间的区别if
.这就是我在做的事情.
sysuse auto,clear
#conditional if
sum price if price>4499
Variable | Obs Mean Std. Dev. Min Max
-------------+--------------------------------------------------------
price | 48 7312.813 3102.784 4504 15906
# programming if
if price>3291{
sum price
}
Variable | Obs Mean Std. Dev. Min Max
-------------+--------------------------------------------------------
price | 74 6165.257 2949.496 3291 15906
# programming if
if price>5000{
sum price
}
This doesn't give me anything
#programming if
if price>4000{
sum price}
Variable | Obs Mean Std. Dev. Min Max …
Run Code Online (Sandbox Code Playgroud) 我在R中有一个数据如下:
bag_id location_type event_ts
2 155 sorter 2012-01-02 17:06:05
3 305 arrival 2012-01-01 07:20:16
1 155 transfer 2012-01-02 15:57:54
4 692 arrival 2012-03-29 09:47:52
10 748 transfer 2012-01-08 17:26:02
11 748 sorter 2012-01-08 17:30:02
12 993 arrival 2012-01-23 08:58:54
13 1019 arrival 2012-01-09 07:17:02
14 1019 sorter 2012-01-09 07:33:15
15 1154 transfer 2012-01-12 21:07:50
Run Code Online (Sandbox Code Playgroud)
class(event_ts)是哪里POSIXct
.
我想在不同的时间找到每个位置的袋子密度.
我使用了命令geom_density(ggplot2)
,我可以很好地绘制它.我想知道density(base)
和这个命令之间是否有任何区别.我的意思是他们正在使用的方法或他们正在使用的默认带宽等有任何区别.
我需要将密度添加到我的数据框中.如果我使用过该函数density(base)
,我知道如何使用该函数approxfun
将这些值添加到我的数据框中,但是我想知道它在使用时是否相同geom_density(ggplot2)
.
我正在使用glmulti()
R中的包来尝试对某些数据运行全子集回归.我有51个预测因子,最多观察到276个.我意识到详尽的遗传算法方法不能用这么多变量计算,因为我收到以下信息:
Warning message:
In glmulti(y = "Tons_N", data = MDatEB1_TonsN, level = 1, method = "h", :
!Too many predictors.
Run Code Online (Sandbox Code Playgroud)
有了这些类型的需求(即许多带有大量观察结果的变量),我可以在一次全子集回归中使用多少个?我正在研究变量消除技术,但我想在分析的这个阶段使用尽可能多的变量.也就是说,我想使用此分析的结果来做出可变消除决策.是否有另一个可以一次处理更多变量的包?
这是我正在使用的代码.不幸的是,由于与项目相关的机密性,我无法附加数据集.
TonsN_AllSubset <- glmulti(Tons_N ~ ., data = MDatEB1_TonsN, level = 1, method = "h",crit = "aic", confsetsize = 20, plotty = T, report = T,fitfunction = "glm")
我对这个软件包和一般的建模都比较陌生.任何方向或建议将不胜感激.谢谢!
我正在使用glm()
R中的函数构建模型.假设我知道我的数据具有适合负二项分布的误差分布.
当我为各种家庭搜索R手册时,family=binomial
作为选项提供,但negative binomial
不是.
在R手册(系列)的同一部分中,NegBinomial
链接在"另请参阅"部分,但它是在二项式系数的上下文中呈现的(我甚至不确定这是指什么).
总而言之,我希望找到与之类似的语法glm(y~x, family=negbinomial, data=d,na.omit)
.
Google R样式指南建议每行最多80个字符。我想知道如何在中设置行长R
。在stata
此完成为:
set linesize 80
Run Code Online (Sandbox Code Playgroud) 如何在Perl中获取对象的数据结构?
我可以使用str轻松地在R中执行此操作
str(data)
Run Code Online (Sandbox Code Playgroud)
我想知道Perl中是否有类似的.
我有一个data.table如下,
library(data.table)
dt<-structure(list(varx = c(0L, 1L, 0L, 0L, 1L, 0L, 1L, 0L, 0L, 0L
), vary = c(0L, 0L, 0L, 0L, 1L, 0L, 1L, 0L, 0L, 0L)), class = c("data.table",
"data.frame"), row.names = c(NA, -10L))
dt
varx vary
1: 0 0
2: 1 0
3: 0 0
4: 0 0
5: 1 1
6: 0 0
7: 1 1
8: 0 0
9: 0 0
10: 0 0
Run Code Online (Sandbox Code Playgroud)
我试图得到以下输出:
dt
varx vary
1: varx_n vary_n
2: varx_y vary_n
3: varx_n …
Run Code Online (Sandbox Code Playgroud) r ×8
stata ×5
glm ×2
data.table ×1
density-plot ×1
ggplot2 ×1
if-statement ×1
panel-data ×1
perl ×1
plm ×1
string ×1
structure ×1
sum ×1