小编Roy*_*lTS的帖子

表格放置与观星者和编织者

我有一个knitr文档,其中包含一个回归结果表作为输出stargazer,如下所示:

\documentclass[11pt]{article}
\begin{document}

<<setup, echo = FALSE, results= 'hide', message = FALSE>>=
data(mtcars)
library(stargazer)
@

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Nullam eleifend molestie nisi, id scelerisque orci venenatis imperdiet. Fusce dictum congue faucibus. Phasellus mollis bibendum tellus eu interdum. Nam sollicitudin congue fringilla. Donec rhoncus viverra lorem vel molestie. Ut varius facilisis ante, a pretium arcu feugiat in. Maecenas sagittis accumsan massa. Pellentesque sollicitudin odio non odio elementum vel tristique dui mattis. Pellentesque …
Run Code Online (Sandbox Code Playgroud)

r knitr

5
推荐指数
1
解决办法
1412
查看次数

Stata:将系数添加到 estout

我想将几个回归的结果输出为格式良好的 LaTeX 表,并且很高兴看到在大多数情况下estoutSSC 上的包似乎正是这样做的。

但是,我想要的是有点特别:在显示系数估计及其标准误差的表格部分和显示 R^2 等的部分之间,我想添加一个显示点估计和标准误差的部分(星星的加分)对于系数的特定线性组合。点估计和标准误差都可以很容易地通过计算lincom得出,但到目前为止,我找到的将这些数字放入表格中的最佳解决方案涉及对这些数字进行大量加法,一次estadd scalar ...一个。有没有更优雅的方法来做到这一点?

示例代码:

sysuse auto
eststo, title("Model 1"): regress price weight mpg
lincom weight+mpg
estadd scalar skal r(estimate)
estadd scalar skalsd r(se)
eststo, title("Model 2"): regress price weight mpg foreign
lincom weight+mpg
estadd scalar skal r(estimate)
estadd scalar skalsd r(se)
label variable foreign "Car type (1=foreign)"
estout, cells(b(star fmt(3)) t(par fmt(2)))  ///
     stats(skal skalsd r2 N, labels("Linear Combination" "S.E." R-squared "N. of cases")) ///
     label legend varlabels(_cons …
Run Code Online (Sandbox Code Playgroud)

stata

5
推荐指数
1
解决办法
5182
查看次数

雅典娜大小为N的随机样本

我正试图N从雅典娜那里获得随机的行样本.但是,因为我想从中抽取这个样本的表格是天真的

SELECT
id
FROM mytable
ORDER BY RANDOM()
LIMIT 100
Run Code Online (Sandbox Code Playgroud)

需要永远运行,大概是因为ORDER BY需要将所有数据发送到单个节点,然后对数据进行混洗和排序.

我知道TABLESAMPLE但是这样可以让人们抽取一定比例的行而不是一些行.有没有更好的方法呢?

presto amazon-athena

5
推荐指数
1
解决办法
5656
查看次数

AWS Athena上的OFFSET

我想在AWS Athena上运行带有a LIMIT和a OFFSET子句的查询.我认为前者是支持而后者不支持.有没有办法用其他方法模拟这个功能?

amazon-web-services presto amazon-athena

5
推荐指数
1
解决办法
3064
查看次数

省略mtable/outreg-type表中的一些系数

我一直在运行一堆不同的回归模型,现在想把他们的估计变成一个LaTeX表.为了使不同规格可比我想用那种表是outregrockchalk包装还是mtablememisc产品,即在其中不同的模型在这些模型列和参数估计值显示将显示在相应的行.这就是我所拥有的:

df <- data.frame(x=rnorm(20),
                 z=rnorm(20),
                 group=gl(5,4,20,labels=paste('group',rep(1:5))))
df$y = 5 + 2*df$x + 5*df$z + rep(c(3.2,5,6.2,8.2,5),each=4) + rnorm(20)

model1 <- lm(y ~ x + z + factor(group),data=df)
model2 <- lm(y ~ x + factor(group),data=df)
model3 <- lm(y ~ x + z,data=df)

library(memisc)

reg.table <- mtable("Model 1"=model1,"Model 2"=model2,"Model 3"=model3,
                summary.stats=c("sigma","R-squared","F","p","N"))

toLatex(reg.table)
Run Code Online (Sandbox Code Playgroud)

这很好用,但我有一个大约200级的因子和相应大量的系数.我想做的是从表中省略与该因子相关的系数或(对于奖励积分!)来表明该因子在模型中使用时带有简单的"是"或"否".所以,我理想的输出是这样的:

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%    %
%
% Calls:
% Model 1:  lm(formula = y ~ x + z + factor(group), data = df) 
% Model …
Run Code Online (Sandbox Code Playgroud)

latex r

4
推荐指数
1
解决办法
677
查看次数

防止在gRaphael饼图中排序

我正在尝试绘制两个饼图gRaphael,如下所示:

var r = new Raphael(0, 0, '100%', '100%'); 

r.piechart(100,120,80,[60,40]);
r.piechart(300,120,80,[40,60]);
Run Code Online (Sandbox Code Playgroud)

这产生了以下图片:

嗯,馅饼

即使我传递给的参数的顺序r.piechart不同,两个饼图也是相同的.有什么方法可以防止这种情况发生,这样其中一个图表底部会有60%的蓝色切片,而另一个图表会保持不变吗?

javascript canvas raphael graphael

4
推荐指数
1
解决办法
1134
查看次数

将当地时间的矢量转换为UTC

我有一个POSIXct稍微误用该格式的向量:

> head(df$datetime)
[1] "2016-03-03 12:30:00 UTC" "2016-03-03 12:00:00 UTC" "2016-02-27 09:00:00 UTC" "2016-03-03 17:30:00 UTC"
[5] "2016-03-03 10:30:00 UTC" "2016-03-03 14:30:00 UTC"
Run Code Online (Sandbox Code Playgroud)

这些日期时间标记为UTC时间,但实际上是各种各样的本地时区:

> df %>% select(datetime, timezone) %>% head
         datetime            timezone
1 2016-03-03 12:30:00 Australia/Melbourne
2 2016-03-03 12:00:00 Europe/Berlin
3 2016-02-27 09:00:00 Europe/Amsterdam
4 2016-03-03 17:30:00 Australia/Brisbane
5 2016-03-03 10:30:00 Europe/Amsterdam
6 2016-03-03 14:30:00 Europe/Berlin
Run Code Online (Sandbox Code Playgroud)

我想将这些日期时间转换为适当的UTC - 从某种意义上说,这里这里面临的逆问题- 但是我很难过.来自第二个链接的解决方案的变体工作:

get_utc_time <- function(timestamp_local, local_tz) {
  l <- lapply(seq(length(timestamp_local)), 
              function(x) {with_tz(force_tz(timestamp_local[x], tzone=local_tz[x]), tzone='UTC')})
  as.POSIXct(combine(l), …
Run Code Online (Sandbox Code Playgroud)

time r

4
推荐指数
1
解决办法
421
查看次数

"使用JDBC驱动程序,请求的fetchSize超过了Athena中允许的值"

我正在尝试使用AWS自己的博客RJDBC中详细描述的将Athena数据库中的数据提取到R 中.唉,我试图提取的数据量很大,所以我收到以下错误信息:

Error in .jcall(rp, "I", "fetch", stride, block) : 
  java.sql.SQLException: The requested fetchSize is more than the allowed value in Athena. Please reduce the fetchSize and try again. Refer to the Athena documentation for valid fetchSize values.
Run Code Online (Sandbox Code Playgroud)

Athena文档实际上并没有给出任何这样的fetchSize值,但是我从这个github问题中收集到的值应该低于1000.我从同一个github问题中收集到没有办法将它传递fetchSize给RJDBC.那么有其他方法可以查询Athena是否尊重这个限制?

r jdbc amazon-web-services amazon-athena

4
推荐指数
1
解决办法
1115
查看次数

所有长度为k的字符串,可以由一组n个字符组成

这个问题已被要求用于其他语言,但我正在寻找最惯用的方法来查找k可以由nR中的一组字符组成的所有长度字符串

示例输入和输出:

input <- c('a', 'b')

output <- c('aa', 'ab', 'ba', 'bb')
Run Code Online (Sandbox Code Playgroud)

string r

3
推荐指数
1
解决办法
56
查看次数

检索 Redshift 错误消息

我正在使用 DataGrip 在 Redshift 集群上运行查询,该查询需要运行 10 个小时以上,不幸的是这些查询经常失败。唉,DataGrip 与数据库的连接时间不够长,无法让我看到查询失败的错误消息。

有没有办法稍后检索这些错误消息,例如使用内部 Redshift 表?或者,有没有办法让 DataGrip 保持连接足够长的时间?

amazon-redshift datagrip

3
推荐指数
1
解决办法
9245
查看次数