最初,我主要想在R中运行带有聚类标准错误的probit/logit模型,这在Stata中非常直观.我在这里得到了答案Logistic回归与R中强大的聚类标准错误.因此,我尝试将Stata和R两者的结果与强大的标准误差和聚类标准误差进行比较.但我注意到软件中两个标准错误的输出并不完全相同.但是,如果我使用此处建议的方法https://diffuseprior.wordpress.com/2012/06/15/standard-robust-and-clustered-standard-errors-computed-in-r/.我可以从R和Stata获得线性回归的确切输出.因此,我担心我在R中编写的代码是不正确的,如果我想运行probit模型而不是logit模型,那么使用什么命令.或者如果有任何优雅的替代方案来解决这个问题?谢谢.
R代码
## 1. linear regression
library(rms)
# model<-lm(Sepal.Length~Sepal.Width+Petal.Length+Petal.Width,iris)
summary(model)
fit=ols(Sepal.Length~Sepal.Width+Petal.Length+Petal.Width, x=T, y=T, data=iris)
fit
robcov(fit) #robust standard error
robcov(fit, cluster=iris$Species) #clustered standard error
## 2. logistic regression
##demo data generation
set.seed(1234)
subj<-rep(1:20,each=4)
con1<-rep(c(1,0),40)
con2<-rep(c(1,1,0,0),20)
effect<-rbinom(80,1,0.34)
data<-data.frame(subj,con1,con2,effect)
library(foreign);write.dta(data,'demo_data.dta')
library(rms)
fit=lrm(effect ~ con1 + con2, x=T, y=T, data=data)
fit
robcov(fit) ##robust standard error
robcov(fit, cluster=data$subj) ## clustered standard error
Run Code Online (Sandbox Code Playgroud)
Stata代码
## 1. linear regression
webuse iris
reg seplen sepwid petlen petwid
reg seplen sepwid petlen petwid,r
reg …Run Code Online (Sandbox Code Playgroud) 我想测试一种线性回归中的系数是否彼此不同,或者它们中至少有一个与一个特定值(例如0)显着不同,这在Stata中似乎很直观。例如
webuse iris
reg iris seplen sepwid petlen
seplen==sepwid==petlen
seplen==sepwid==petlen==0
我想知道如果要在R中测试它怎么办?
我有两列时间信息,在data.frame中使用分钟和秒,没有附加日期信息,现在我想计算这两列之间的差异,并在几秒钟内获得diff_time(end_time-start_time)的新列(diff_time1)或者在原始变量(diff_time2)中表示的分钟和秒数,如何在R中计算?例如:
start_time end_time diff_time1 diff_time2
12'10" 16'23" 4'13" 253
1'05" 76'20" 75'15" 4515
96'10" 120'22" 24'12" 1452
Run Code Online (Sandbox Code Playgroud) 在Python,对于数据帧中的包数据切片熊猫,.IX已经从熊猫0.20.0弃用。官方网站提供了使用.loc或.iloc的替代解决方案来进行混合选择(http://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html)。该的.index可以帮助提取多行。相比之下,columns.get_loc似乎最多只能选择一列。是否有可用的替代功能,可以使用.iloc以混合方式提取多个列?