小编joh*_*zhj的帖子

用于概率和logit回归的R中的鲁棒和聚类标准误差

最初,我主要想在R中运行带有聚类标准错误的probit/logit模型,这在Stata中非常直观.我在这里得到了答案Logistic回归与R中强大的聚类标准错误.因此,我尝试将Stata和R两者的结果与强大的标准误差和聚类标准误差进行比较.但我注意到软件中两个标准错误的输出并不完全相同.但是,如果我使用此处建议的方法https://diffuseprior.wordpress.com/2012/06/15/standard-robust-and-clustered-standard-errors-computed-in-r/.我可以从R和Stata获得线性回归的确切输出.因此,我担心我在R中编写的代码是不正确的,如果我想运行probit模型而不是logit模型,那么使用什么命令.或者如果有任何优雅的替代方案来解决这个问题?谢谢.

R代码

## 1. linear regression
library(rms) 
# model<-lm(Sepal.Length~Sepal.Width+Petal.Length+Petal.Width,iris)
summary(model)
fit=ols(Sepal.Length~Sepal.Width+Petal.Length+Petal.Width, x=T, y=T, data=iris)
fit
robcov(fit) #robust standard error
robcov(fit, cluster=iris$Species) #clustered standard error


## 2. logistic regression
##demo data generation   
set.seed(1234)
subj<-rep(1:20,each=4)
con1<-rep(c(1,0),40)
con2<-rep(c(1,1,0,0),20) 
effect<-rbinom(80,1,0.34)
data<-data.frame(subj,con1,con2,effect)
library(foreign);write.dta(data,'demo_data.dta')

library(rms)
fit=lrm(effect ~ con1 + con2, x=T, y=T, data=data)
fit
robcov(fit)  ##robust standard error
robcov(fit, cluster=data$subj) ## clustered standard error
Run Code Online (Sandbox Code Playgroud)

Stata代码

## 1. linear regression
webuse iris
reg seplen sepwid petlen petwid
reg seplen sepwid petlen petwid,r
reg …
Run Code Online (Sandbox Code Playgroud)

r

7
推荐指数
1
解决办法
3708
查看次数

R代码可通过一次回归测试回归系数之间的差异

我想测试一种线性回归中的系数是否彼此不同,或者它们中至少有一个与一个特定值(例如0)显着不同,这在Stata中似乎很直观。例如

webuse iris reg iris seplen sepwid petlen seplen==sepwid==petlen seplen==sepwid==petlen==0

我想知道如果要在R中测试它怎么办?

r regression-testing

4
推荐指数
1
解决办法
8609
查看次数

如何获得分钟和秒的时差?

我有两列时间信息,在data.frame中使用分钟和秒,没有附加日期信息,现在我想计算这两列之间的差异,并在几秒钟内获得diff_time(end_time-start_time)的新列(diff_time1)或者在原始变量(diff_time2)中表示的分钟和秒数,如何在R中计算?例如:

      start_time  end_time  diff_time1  diff_time2
       12'10"     16'23"      4'13"      253
       1'05"      76'20"      75'15"     4515  
       96'10"     120'22"     24'12"     1452
Run Code Online (Sandbox Code Playgroud)

time r

3
推荐指数
1
解决办法
644
查看次数

如何在熊猫中选择不包含不推荐使用的ix的多列

在Python,对于数据帧中的包数据切片熊猫.IX已经从熊猫0.20.0弃用。官方网站提供了使用.loc.iloc的替代解决方案来进行混合选择(http://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html)。该的.index可以帮助提取多行。相比之下,columns.get_loc似乎最多只能选择一列。是否有可用的替代功能,可以使用.iloc以混合方式提取多个列?

python pandas

3
推荐指数
1
解决办法
141
查看次数

标签 统计

r ×3

pandas ×1

python ×1

regression-testing ×1

time ×1