小编Mar*_*rco的帖子

有没有办法在 R 中使用 stargazer 导出 feols 模型？

feols我使用model （包）运行了一堆模型fixest，但是我在使用stargazer. 关于我如何做到这一点有什么建议吗？

看起来我确实可以使用etable函数，但我想使用函数stargazer，因为我想在表格中添加几行注释并按照我想要的方式格式化表格（例如table.layout在中使用函数stargazer）。

export r stargazer fixest

Dr.*_*tam

2023 01-21

7
推荐指数

1
解决办法

4614
查看次数

使用 st_distance 计算两组点之间的所有距离

我有两组点作为sf对象存储在 R 中。点对象 x 包含 204,467 个点，点 y 包含 5,297 个点。

理论上，我想计算从 x 中的所有点到 y 中的所有点的距离。我知道这会创建一个庞大的矩阵，但在我的 i7 桌面上使用该st_distance(x, y, by_element=FALSE)包sf大约需要 40 分钟。

我想要做的是计算从 x 中的所有点到 y 中的所有点的距离，然后我想将其转换为 a data.frame，其中包含相应 x 和 y 对点的所有变量。这是因为我希望使用进行聚合方面的灵活性dplyr，例如，我想找到 y 中距离 x 10、50、100 公里以内的点的数量，以及其中x$year < y$year。

我成功创建了距离矩阵，其中包含大约 1,083,061,699 个单元格。我知道这是一种非常低效的方法，但它在聚合方面提供了灵活性。欢迎其他建议。

下面是创建两个 sf 点对象并测量它们之间距离的代码。接下来，我想将其转换为包含 x 和 y 中所有变量的 data.frame，但这是我无法继续的地方。

如果我建议的工作流程不可行，有人可以提供替代解决方案来测量到预定义半径内所有点的距离，并使用 x 和 y 中的所有变量创建结果的 data.frame 吗？

# Create two sf point objects 
set.seed(123)
library(sf)


pts1 <- …

Run Code Online (Sandbox Code Playgroud)

r r-sf

spe*_*seh

2023 07-26

5
推荐指数

1
解决办法

3223
查看次数

有没有办法将弹性对象导出到 Excel？

我想尝试将弹性对象导出到 Excel 电子表格，但我找不到任何解决方案。根据此文档（https://davidgohel.github.io/flextable/reference/index.html），该包允许用户将可格式化对象导出为 pdf、文档和 ppt。

一种解决方法是将其保存为其中一种格式，然后将其保存到 Excel 电子表格中，但我正在寻找一种不太黑客且可扩展到许多表的解决方案。

excel r flextable

ati*_*e88

2023 01-24

5
推荐指数

1
解决办法

3199
查看次数

使用 dplyr 计算分组数据中相关性的显着性

我已经对数据进行了分组，我想测试几个基本的推理统计数据。

library(tidyverse)

df <- data.frame(x=runif(50, min = 0, max = 25),y=runif(50, min = 10, max = 25), group=rep(0:1,25))

df %>%
  group_by(group) %>%
  summarize(cor(x,y))

Run Code Online (Sandbox Code Playgroud)

在这里我可以很容易地得到相关性，但我还需要检查它的统计显着性。不幸的是，像cor.test这样的选项在dyplr. 有简单的解决方法吗？

r significance dplyr pearson-correlation

Mar*_*rco

lucky-day

4
推荐指数

1
解决办法

316
查看次数

ggplot：如何通过点和线的颜色和形状显示多个组

我想绘制 xy 变量的点线图并突出显示两个分组。我知道一些区分因素的选项，例如fill、shape或。对于第一组，我想要有颜色，对于第二组形状（可能有也可能没有相同的颜色）。我需要一个图例来区分这两个分组（我已经有了）。也许我必须将 aes 放入 geom_line 或 geom_point 中，但我不确定。因为后来我想调整形状的大小（以更好地区分这些形状）。colgroup

如何用彩色线连接这些点？
如何调整形状组的大小？

这是我的代码：

library(ggplot2) 
data <- data.frame(id1=c(1,1,1,2,2,2,3,3,3,4,4,4), 
                  id2=seq(1:3), year=seq(from=2007, to=2018, by=1),
                  variable=rep(c(5:8), each=3))

# two groups by color and shape, but it drops the line (seperate legends, thats nice)
ggplot(data, aes(x=year, y=variable, col=factor(id1), shape=factor(id2))) + 
  geom_line() + geom_point()

Run Code Online (Sandbox Code Playgroud)

r ggplot2

Mar*_*rco

2020 03-06

4
推荐指数

1
解决办法

2万
查看次数

在 ggplot 中用文本和框（和箭头）标记特定数据点

我有一个散点图和基础回归模型。我想在另一个数据点上给出一个很好的例子（假设不包含在估计样本中），即它的实际值与预测值。除了标签之外，我已经准备好了一切（考虑geom_text或geom_label，到目前为止没有任何效果）：

data(mtcars)

model <- lm(mpg ~ wt, data=mtcars)
mycar <- data.frame(wt=c(2.5))
predict(model, mycar)

model <- lm(Coupon ~ Total, data=df)
mycar <- data.frame(Total=c(79037022, 83100656, 104299800))
predict(model, new.df)

ggplot(mtcars, aes(x=wt, y=mpg)) +
  geom_point() +
  geom_smooth(method="lm", se=FALSE) +
  geom_point(aes(x=2.5,y=23.92395),   # red is the prediction for my car
             color='red',
             size=3, show.legend = TRUE) + 
  geom_point(aes(x=2.5,y=28),         # green is the actual mpg of my car
             color='green',
             size=3)

Run Code Online (Sandbox Code Playgroud)

我对具体实施很灵活：

文本的颜色可以与数据点的颜色相同（没有线条或箭头）
带线条或箭头的黑色文本（需要框背景，因为在实际数据中，数据云几乎到处都是黑色）
可能有一个图例将手动添加点的颜色映射到文本标签（尽管我喜欢数据点旁边的标签）。
...

我正在寻找易于实施且具有视觉吸引力的东西。谢谢

r ggplot2

Mar*_*rco

lucky-day

3
推荐指数

1
解决办法

2809
查看次数

总结使用 dplyr 和 for 循环

我想使用dplyrfor 循环来总结每个自变量（列）和目标变量。这是我的主要数据框：

  Contract_ID Asurion Variable_1 Variable_2 Variable_3
         1 年 acf
         2 年平均
         3N BCG
         4 N adf
         5 年 bcf
         6 Y adf

分组后我得到

a1 <- a %>% 
  group_by(Asurion,BhvrBnk_Donates_to_Env_Causes) %>%       
  summarise(counT=n_distinct(CONTRACT_ID)) %>%                                        
  mutate(perc=paste0(round(counT/sum(counT)*100,2),"%"))

 Asurion Variable_1 CounT   perc
    Y         a        3     75%
    Y         b        1     25%
    N         a        1     50%
    N         b        1     50%

Run Code Online (Sandbox Code Playgroud)

我希望对数据框中存在的每个变量进行汇总，并且我想使用 for 循环来完成此操作。我怎样才能达到我想要的结果

这是我尝试使用的，但似乎不起作用。这是一个学校项目，我需要为此使用 for 循环。请在这里帮助我

categorical <- colnames(a)###where categroical is the names of all columns in a  
###I would like to have a for …

Run Code Online (Sandbox Code Playgroud)

for-loop group-by r dplyr summarize

Aas*_*mar

2019 11-04

2
推荐指数

1
解决办法

4035
查看次数

如何在Stata中按“今天”导出回归模型结果和标签？

我运行一系列回归模型（几乎每天）。我通过用日期（年-月-日格式）标记导出的回归结果来手动跟踪我的结果。这如何在 Stata 中自动化（使用outreg2Word）？这是一个最小的工作示例：

* load data
use http://www.stata-press.com/data/r13/nlswork

* regression 
reg ln_wage c.age c.wks_u i.race i.union 

* export results in word document in a file appended by "today"/date
outreg2 using "C:\PATH\Results\model_1_2020_08_21.doc", word

Run Code Online (Sandbox Code Playgroud)

regression stata

Mar*_*rco

2020 08-21

2
推荐指数

1
解决办法

203
查看次数

在R中从多边形质心到最大距离边界绘制一条线

我有德国邮政编码的多边形形状数据。对于每个邮政编码，我喜欢计算从质心到其边界的最大距离，并在地图上对其中一些邮政编码进行说明。sf我找到了一篇通过包 andst_cast()计算这个最大值的帖子st_distance()。我的数据为 sf 数据框。

如何使用 SF 包计算质心和多边形边缘之间的最大距离？

library(sf)
library(tidyverse)

# Get German postcode shape polygons
URL <- "https://downloads.suche-postleitzahl.org/v2/public/plz-5stellig.shp.zip"

# use GDAL virtual file systems to load zipped shapefile from remote url
GER_postcode <- paste0("/vsizip//vsicurl/", URL) %>%  read_sf()

# convert numeric
GER_postcode$plz <- as.numeric(GER_postcode$plz)

# filter a specific postcode
test <- GER_postcode %>% filter(plz == 15232)

# compute distances 
distances <- test %>% 
  st_cast("POINT") %>% 
  st_distance(st_centroid(test))

# maximum dist:
max_dist <- max(distances)
max_dist

ggplot() + …

Run Code Online (Sandbox Code Playgroud)

r geospatial ggplot2 r-sf

Mar*_*rco

lucky-day

2
推荐指数

1
解决办法

137
查看次数