我的例子是:
qplot(mtcars$mpg) + annotate(geom = "text", x = 30, y = 3, label = "Some text\nSome more text")
Run Code Online (Sandbox Code Playgroud)
如何让这里的文字保持对齐?所以'有些人相互排队.
有没有人有一个很好的清洁方式来获取模型的predict
行为felm
?
library(lfe)
model1 <- lm(data = iris, Sepal.Length ~ Sepal.Width + Species)
predict(model1, newdata = data.frame(Sepal.Width = 3, Species = "virginica"))
# Works
model2 <- felm(data = iris, Sepal.Length ~ Sepal.Width | Species)
predict(model2, newdata = data.frame(Sepal.Width = 3, Species = "virginica"))
# Does not work
Run Code Online (Sandbox Code Playgroud) 当我运行集群标准错误面板规范时plm
,lfe
我得到的结果在第二个有效数字上有所不同.有谁知道为什么他们的SE计算不同?
set.seed(572015)
library(lfe)
library(plm)
library(lmtest)
# clustering example
x <- c(sapply(sample(1:20), rep, times = 1000)) + rnorm(20*1000, sd = 1)
y <- 5 + 10*x + rnorm(20*1000, sd = 10) + c(sapply(rnorm(20, sd = 10), rep, times = 1000))
facX <- factor(sapply(1:20, rep, times = 1000))
mydata <- data.frame(y=y,x=x,facX=facX, state=rep(1:1000, 20))
model <- plm(y ~ x, data = mydata, index = c("facX", "state"), effect = "individual", model = "within")
plmTest <- coeftest(model,vcov=vcovHC(model,type = "HC1", cluster="group"))
lfeTest …
Run Code Online (Sandbox Code Playgroud) 我试图估计一个具有滞后和多组效应的大型动态固定效果面板数据模型.
我知道包中的pseries
对象plm
可以处理具有滞后的面板回归.
library(plm)
data("EmplUK", package = "plm")
Em <- pdata.frame(EmplUK)
plm(emp~output+capital + lag(wage, 1),data=Em,model="within")
Run Code Online (Sandbox Code Playgroud)
lfe
面板对象的包装中是否有类似的解决方案,以便我可以利用提供的快速性lfe
?
我的问题与这个问题密切相关:
我试图将一个大向量分成已知的块大小,但速度很慢。具有偶数余数的向量的解决方案在这里:
存在因素时的快速解决方案如下:
我想处理没有(大)因素存在的情况,因为我想要相当大的块。
我的矢量示例比我现实生活中的矢量小得多:
d <- 1:6510321
# Sloooow
chunks <- split(d, ceiling(seq_along(d)/2000))
Run Code Online (Sandbox Code Playgroud) 例如,是否可以在dplyr中执行此操作:
new_name <- "Sepal.Sum"
col_grep <- "Sepal"
iris <- cbind(iris, tmp_name = rowSums(iris[,grep(col_grep, names(iris))]))
names(iris)[names(iris) == "tmp_name"] <- new_name
Run Code Online (Sandbox Code Playgroud)
这会将名称中包含"Sepal"的所有列相加,并创建一个名为"Sepal.Sum"的新变量.
重要的是,该解决方案需要依靠一个grep
(或dplyr:::matches
,dplyr:::one_of
等)选择用于该列时rowSums
的功能,并有新的列的名称是动态的.
我的应用程序在循环中创建了许多新列,因此可以使用更好的解决方案mutate_each_
来生成许多新列.