小编Hei*_*erg的帖子

在jekyll本地开发期间将site.url更改为localhost

我的jekyll博客模板包含资源和页面的链接,如下所示:

{{ site.url }}/my-page.html

Run Code Online (Sandbox Code Playgroud)

这在部署中很有效,但是当我jekyll serve在开发中运行时,所有链接都指向实时页面而不是开发页面.

my-site-url/my-page.html

# But I want this in development
localhost:4000/my-page.html

Run Code Online (Sandbox Code Playgroud)

有没有办法让jekyll {{ site.url }}在开发中使用不同的东西？

hyperlink jekyll

Hei*_*erg

lucky-day

72
推荐指数

1
解决办法

2万
查看次数

ggplot2 - 大小的单位

一个我无法在网上找到答案的快速问题(或Wickham的书):

ggplot2中size参数的单位是多少？例如,geom_text(size = 10) - 10个单位是多少？

编辑:同样的问题适用于ggsave中的默认单位(高度= 10,宽度= 10)

r ggplot2

Hei*_*erg

2013 06-26

37
推荐指数

2
解决办法

1万
查看次数

position_dodge中的width参数是什么？

文档没有解释这个width论点到底是什么

它指定的宽度是多少？
什么是"单位"？
什么是默认值？

默认值为width = NULL,但试验和错误显示width = 0.9似乎产生默认效果(请参阅postscript).但是,我找不到ggplot2源代码中设置此类默认值的位置.从而,

你能解释一下如何在ggplot2代码中实现默认闪避吗？

问题的精神是允许ggplot2用户在width没有反复试验的情况下找到合适的值.PS:

ggplot(data = df) +
  geom_bar(aes(x, y, fill = factor(group)), 
           position = position_dodge(), stat = "identity")

ggplot(data = df) +
  geom_bar(aes(x, y, fill = factor(group)), 
           position = position_dodge(0.9), stat = "identity")

Run Code Online (Sandbox Code Playgroud)

r ggplot2

Hei*_*erg

2016 01-20

36
推荐指数

1
解决办法

2万
查看次数

强制pandas .iloc返回单行数据帧？

出于编程目的,我希望.iloc始终返回数据帧,即使结果数据帧只有一行.怎么做到这一点？

目前,.iloc当结果只有一行时返回一个Series.例:

In [1]: df = pd.DataFrame({'a':[1,2], 'b':[3,4]})

In [2]: df
Out[2]:
   a  b
0  1  3
1  2  4

In [3]: type(df.iloc[0, :])
Out[3]: pandas.core.series.Series

Run Code Online (Sandbox Code Playgroud)

由于两个原因,此行为很差:

根据所选行的数量,.iloc可以返回一个系列或一个数据框,迫使我在我的代码中手动检查这一点

~~- .loc另一方面,总是返回一个数据框,使其pandas内部不一致~~(错误的信息,如评论中所指出的)

对于R用户,可以使用drop = FALSE或使用tidyverse的tibble 来完成,tidyverse的tibble默认情况下始终返回数据帧.

python indexing dataframe pandas

Hei*_*erg

2017 09-01

26
推荐指数

3
解决办法

8362
查看次数

在dplyr管道中执行嵌套函数的顺序

当我在管道步骤中使用嵌套函数时,执行顺序似乎不直观.

df <- data.frame(a = c(1,NA,2), b = c(NA, NA, 1))
df %>% is.na %>% colSums # Produce correct count of missing values
df %>% colSums(is.na(.)) # Produce NA

Run Code Online (Sandbox Code Playgroud)

谁能解释为什么第三行中的嵌套函数不能产生正确的结果？

r dplyr magrittr

Hei*_*erg

2018 04-04

13
推荐指数

1
解决办法

696
查看次数

在Python/Spyder中设置工作目录,以便它可以重现

来自R,使用setwd更改目录是一个很大的禁止再现性,因为其他人没有与我相同的目录结构.因此,建议使用脚本位置的相对路径.

IDE稍微复杂一点,因为它们设置了自己的工作目录.在Rstudio中,我可以轻松解决Rstudio项目的这个问题,将项目目录设置为我的脚本文件夹.

使用Python和Spyder,似乎没有任何解决方案.Spyder没有像Rstudio这样的功能.在进行交互式分析时(因为不可用),将目录设置为脚本的位置不起作用__file__.

怎么办,Python/Spyder中的工作目录是可重现的？

python spyder reproducible-research

Hei*_*erg

2017 05-23

13
推荐指数

3
解决办法

4万
查看次数

如何关闭"点击<返回>看下一个情节"提示plot3D？

当persp3D在包中使用时plot3D,只产生了一个图,但我仍然必须响应"点击<返回>以查看下一个图"提示.有没有办法把它关掉？

更一般地,当有多个地块,做包通常提供一种方式来指定一个特定的情节显示,类似which = c(1:3, 5)的争论plot.lm？

plot r

Hei*_*erg

2016 01-18

12
推荐指数

2
解决办法

1万
查看次数

使用避难所导入Stata数据后访问变量标签的便捷方式

在R中,一些包(例如haven)将label属性插入变量(例如haven),这解释了变量的实质名称.例如,gdppc可能有标签GDP per capita.

这非常有用,尤其是从Stata导入数据时.但是,我仍然很难知道如何在我的工作流程中使用它.

如何快速浏览变量和变量标签？现在我必须这样做attributes(df$var),但这一点不太方便(la names(df))
如何在地块中使用这些标签？同样,我可以attr(df$var, "label")用来访问字符串标签.但是,这似乎很麻烦.

有没有官方的方法在工作流程中使用这些标签？我当然可以编写一个包装的自定义函数attr,但是当包以label不同方式实现属性时,它可能会在将来中断.因此,理想情况下,我想要一种由haven(或其他主要包)支持的官方方式.

label r stata r-haven

Hei*_*erg

2016 01-16

11
推荐指数

3
解决办法

5560
查看次数

SQL UNION 不检查匹配的列名——这取决于我吗？

我非常惊讶，UNION只是简单地连接行而不检查列名是否匹配。

例如，

SELECT 
    1 AS bar,
    2 AS foo

UNION ALL

SELECT 
    10 AS foo,
    20 AS bar

Run Code Online (Sandbox Code Playgroud)

产生

bar foo
1   2
10  20

Run Code Online (Sandbox Code Playgroud)

而我希望 SQL 会抱怨两个表中第一列的名称不同。

这是 SQL 的预期行为吗？如果是这样，对我来说这似乎是一个出现语义错误的巨大机会。我可以使用哪些方法来防止犯这种错误？对于UNION有很多列的大型系统，除了手动检查之外，如何确保列按相同顺序排列？

sql

Hei*_*erg

lucky-day

11
推荐指数

1
解决办法

9106
查看次数

将数据从Google App Engine导出到csv

这个旧答案指向Google App Engine文档上的链接,但该链接现在是关于备份您的GAE数据,而不是下载它.

那么如何将所有数据下载到csv中呢？数据很小,即<1 GB

python csv google-app-engine

Hei*_*erg

2017 05-23

10
推荐指数

2
解决办法

6098
查看次数

标签统计

r ×5

python ×3

ggplot2 ×2

csv ×1

dataframe ×1

dplyr ×1

google-app-engine ×1

hyperlink ×1

indexing ×1

jekyll ×1

label ×1

magrittr ×1

pandas ×1

plot ×1

r-haven ×1

reproducible-research ×1

spyder ×1

sql ×1

stata ×1

标签 统计

小编Hei_erg的帖子

标签统计