小编bil*_*999的帖子

R - ggplot2 - geom_line - 删除缺失值的直线

我有我试图绘制的数据.我有几个变量,范围从1880年至2012年.我每年有一次观察.但有时一个变量几年没有观察.例如,它可能有1880年至1888年的观察,但不是1889年至1955年,然后是1956年至2012年.我希望ggplot2 + geom_line在失踪年份(1889-1955)没有任何东西.但它将1888年和1956年的直线相连.我有什么办法可以删除这一行吗?我正在使用ggplot函数.

无关的问题,但有没有办法让ggplot不按字母顺序在图例中对变量名进行排序?我有这样的代码:

ggplot(dataFrame, aes(Year, value, colour=Name)) + geom_line()
Run Code Online (Sandbox Code Playgroud)

或者在变量名称(Name1,...,Name10)前面添加数字到图例.例如,1.Name1 2. Name2 ... 10. Name10

r ggplot2

3
推荐指数
1
解决办法
6237
查看次数

使用数字随机分配而无需替换

我有100行的数据集和我有4个值的字符串(A,B,C,D)我想随机分配给行.但是,我想分配A30行,B20行,C10行和D40行.我该怎么做?

df <- data.frame(ID=c(1:100))
values <- c("A", "B", "C", "D")
Run Code Online (Sandbox Code Playgroud)

我想到的一种方法是生成一个随机排序的数字列表1-100并分配前10个A,依此类推,但我想有一个比这更好的方法.

random r

3
推荐指数
1
解决办法
3553
查看次数

Stata 事件研究图代码

我正在尝试为 Stata 中的事件研究编写代码,但我无法完全得到我想要的。Jacobson, LaLonde, and Sullivan (1993), page 698 Figure 3 ( http://www.princeton.edu/~davidlee/wp/0.pdf ),有一个与我想要的非常相似的情节,除了我还想添加置信区间。

基于本教程http://www.stata.com/meeting/germany14/abstracts/materials/de14_jann.pdf,我编写了以下代码:

sysuse auto, clear
egen t = fill(1,2,3,4,1,2,3,4)
quietly regress price ib2.t trunk weight if foreign==0
estimates store domestic
quietly regress price ib2.t trunk weight if foreign==1
estimates store foreign
coefplot (domestic, label(Domestic Cars)) (foreign, label(Foreign Cars)), drop(_cons) xline(0) vertical omitted baselevels
Run Code Online (Sandbox Code Playgroud)

这产生了我想要的东西,但存在以下问题:

  1. 点估计和置信区间是并排的,而不是相互叠加(如果这是唯一的问题,这可能没问题)。
  2. 我的时间变量 t 出现在每个 x 标签(t=1、t=2 等)中,但我只想说(1、2 等)而没有 t=。
  3. 在这个玩具示例中,我不得不从 1 开始我的 t 编号,因为与i运算符结合的因子变量需要是非负的。我希望我的时间变量能够取负数。
  4. 我不想trunkweight出现在情节中。把这些放在里面可以 …

plot regression graph stata

3
推荐指数
1
解决办法
1万
查看次数

如何更快地渲染 ggplot2+gganimate+ggflags

我正在使用 ggplot2+gganimate+ggflags 制作绘图,但渲染速度非常慢:通常每秒 0.1 帧或低于 0.1 帧。因此,如果我有 300 帧,则需要很长时间。我注意到是 ggflags 导致它变得比其他方式慢得多。我可以做些什么来加快渲染速度?我正在使用 MacBook Pro。

我非常基本的代码设置如下所示:

plot <- data %>% ggplot2(aes(...)) + geom_flag(...) + lots of options + transition_time(year) 

anim_save("file.gif", plot, ...)
Run Code Online (Sandbox Code Playgroud)

r render ggplot2 gganimate

3
推荐指数
1
解决办法
1140
查看次数

运行 git pull 后如何解决错误 bad object refs/heads/main (1)

git pull当我在 Mac 上的终端中运行时,如何解决此错误?

remote: Enumerating objects: 115, done.
remote: Counting objects: 100% (115/115), done.
remote: Compressing objects: 100% (66/66), done.
remote: Total 104 (delta 71), reused 63 (delta 30), pack-reused 0
Receiving objects: 100% (104/104), 3.92 MiB | 3.16 MiB/s, done.
Resolving deltas: 100% (71/71), completed with 9 local objects.
fatal: bad object refs/heads/main (1)
error: https://github.com/[...domain name...]/website.git did not send all necessary objects
Run Code Online (Sandbox Code Playgroud)

背景是我有一个网站,通常运行没有问题。我在 RStudio 中创建它并与 github 同步。Netlify 就是从这里开始的。以下是设置的基础: https: //www.apreshill.com/blog/2020-12-new-year-new-blogdown/

在 RStudio 中进行更改后,我通常可以在 RStudio 内提交并推送更改。但这一次,它是这样说的: …

git r github git-pull rstudio

3
推荐指数
1
解决办法
3488
查看次数

R - 对具有相似名称的多个变量使用rbind

我有很多变量,我使用这样的代码创建:

for (i in 1:10) {
    assign(paste0("variable", i), i )}
Run Code Online (Sandbox Code Playgroud)

我现在需要在变量上使用rbind来组合它们.我尝试过这样的事情无济于事:

rbind(assign(paste0("variable", 1:10)))
Run Code Online (Sandbox Code Playgroud)

有关该怎么办的任何建议?

r rbind

2
推荐指数
1
解决办法
4104
查看次数

如何在热图图上添加黑线

我创建以下样本热图:

library(reshape2) 
library(ggplot2) 
require(gridExtra)
library(RColorBrewer)
colors <- brewer.pal(9, 'Reds')
sample_data <- data.frame(matrix(sample(36, 36), nrow=6))
sample_data$id<-rownames(sample_data)
sample_data2 <- melt(sample_data, id.var="id")
ggplot(sample_data2, aes(as.factor(variable), as.factor(id), group=id)) +
    geom_tile(aes(fill = value)) + 
    geom_text(aes(fill = sample_data2$value, label = sample_data2$value), size=3) +
    scale_fill_gradientn(colours = colors) + 
    labs(x = "variable", y = "id", title="heat map")
Run Code Online (Sandbox Code Playgroud)

这将产生如下图: 在此处输入图片说明

我的问题是如何添加暗线以分隔选定的图块?我已使用第三方软件程序在下图中说明了这一点:

在此处输入图片说明

charts plot r line ggplot2

2
推荐指数
1
解决办法
1214
查看次数

计算 0 值的数量

与这里类似,我可以计算缺失观察的数量:

data dataset;
  input a b c;
cards;
1 2 3
0 1 0
0 0 0
7 6 .
. 3 0
0 0 .
;
run;

proc means data=dataset NMISS N;
run;
Run Code Online (Sandbox Code Playgroud)

但我怎样才能计算观察值的数量呢0

sas

2
推荐指数
1
解决办法
5854
查看次数

如何在同一图表上获得多个系数

在Stata中,我正在使用该coefplot包来尝试在同一个图上绘制多个回归中的一个系数(换句话说,将有多个系数,但每个系数来自不同的回归).

下面是代码(与绘制相同系数随时间变化相关),当每个回归中的系数具有相同的名称时,它会完成此操作:

ssc install coefplot
sysuse auto, clear
estimates clear
regress price mpg if foreign==0
est sto t1
regress price mpg if foreign==1
est sto t2
regress price mpg if rep78==5
est sto t3
coefplot t1 || t2 || t3, drop(_cons) vertical bycoefs yline(0)
Run Code Online (Sandbox Code Playgroud)

这一切都很好,花花公子.但是,当每个回归的系数与不同的变量相关时,我怎么能完成同样的事情呢?例如:

estimates clear
regress price mpg if foreign==0
est sto t1
regress price trunk if foreign==1
est sto t2
regress price weight if rep78==5
est sto t3
coefplot t1 || …
Run Code Online (Sandbox Code Playgroud)

graphics plot stata coefficients

2
推荐指数
1
解决办法
861
查看次数

如何使用旧回归中的存储e(b)进行预测

我知道可以得到如下预测值:

reg y x1 x2 x3
predict pred_values
Run Code Online (Sandbox Code Playgroud)

假设我进行回归并存储值:

reg y x1 x2
matrix stored_b = e(b)
Run Code Online (Sandbox Code Playgroud)

然后,我进行另一次回归(无论如何)。

是否可以使用predictusing命令stored_b代替当前命令e(b)

(当然,我可以通过基于手动计算预测值来生成预测值stored_b,但是如果系数很多,这可能会很乏味。)

regression predict stata

1
推荐指数
1
解决办法
846
查看次数

标签 统计

r ×6

ggplot2 ×3

plot ×3

stata ×3

regression ×2

charts ×1

coefficients ×1

gganimate ×1

git ×1

git-pull ×1

github ×1

graph ×1

graphics ×1

line ×1

predict ×1

random ×1

rbind ×1

render ×1

rstudio ×1

sas ×1