小编Hei*_*erg的帖子

在jekyll本地开发期间将site.url更改为localhost

我的jekyll博客模板包含资源和页面的链接,如下所示:

{{ site.url }}/my-page.html
Run Code Online (Sandbox Code Playgroud)

这在部署中很有效,但是当我jekyll serve在开发中运行时,所有链接都指向实时页面而不是开发页面.

my-site-url/my-page.html

# But I want this in development
localhost:4000/my-page.html
Run Code Online (Sandbox Code Playgroud)

有没有办法让jekyll {{ site.url }}在开发中使用不同的东西?

hyperlink jekyll

72
推荐指数
1
解决办法
2万
查看次数

ggplot2 - 大小的单位

一个我无法在网上找到答案的快速问题(或Wickham的书):

ggplot2中size参数的单位是多少?例如,geom_text(size = 10) - 10个单位是多少?

编辑:同样的问题适用于ggsave中的默认单位(高度= 10,宽度= 10)

r ggplot2

37
推荐指数
2
解决办法
1万
查看次数

position_dodge中的width参数是什么?

文档没有解释这个width论点到底是什么

  1. 它指定的宽度是多少?
  2. 什么是"单位"?
  3. 什么是默认值?

默认值为width = NULL,但试验和错误显示width = 0.9似乎产生默认效果(请参阅postscript).但是,我找不到ggplot2源代码中设置此类默认值的位置.从而,

  1. 你能解释一下如何在ggplot2代码中实现默认闪避吗?

问题的精神是允许ggplot2用户在width没有反复试验的情况下找到合适的值.PS:

ggplot(data = df) +
  geom_bar(aes(x, y, fill = factor(group)), 
           position = position_dodge(), stat = "identity")

ggplot(data = df) +
  geom_bar(aes(x, y, fill = factor(group)), 
           position = position_dodge(0.9), stat = "identity")
Run Code Online (Sandbox Code Playgroud)

r ggplot2

36
推荐指数
1
解决办法
2万
查看次数

强制pandas .iloc返回单行数据帧?

出于编程目的,我希望.iloc始终返回数据帧,即使结果数据帧只有一行.怎么做到这一点?

目前,.iloc当结果只有一行时返回一个Series.例:

In [1]: df = pd.DataFrame({'a':[1,2], 'b':[3,4]})

In [2]: df
Out[2]:
   a  b
0  1  3
1  2  4

In [3]: type(df.iloc[0, :])
Out[3]: pandas.core.series.Series
Run Code Online (Sandbox Code Playgroud)

由于两个原因,此行为很差:

  • 根据所选行的数量,.iloc可以返回一个系列或一个数据框,迫使我在我的代码中手动检查这一点

- .loc另一方面,总是返回一个数据框,使其pandas内部不一致(错误的信息,如评论中所指出的)

对于R用户,可以使用drop = FALSE或使用tidyverse的tibble 来完成,tidyverse的tibble默认情况下始终返回数据帧.

python indexing dataframe pandas

26
推荐指数
3
解决办法
8362
查看次数

在dplyr管道中执行嵌套函数的顺序

当我在管道步骤中使用嵌套函数时,执行顺序似乎不直观.

df <- data.frame(a = c(1,NA,2), b = c(NA, NA, 1))
df %>% is.na %>% colSums # Produce correct count of missing values
df %>% colSums(is.na(.)) # Produce NA
Run Code Online (Sandbox Code Playgroud)

谁能解释为什么第三行中的嵌套函数不能产生正确的结果?

r dplyr magrittr

13
推荐指数
1
解决办法
696
查看次数

在Python/Spyder中设置工作目录,以便它可以重现

来自R,使用setwd更改目录是一个很大的禁止再现性,因为其他人没有与我相同的目录结构.因此,建议使用脚本位置的相对路径.

IDE稍微复杂一点,因为它们设置了自己的工作目录.在Rstudio中,我可以轻松解决Rstudio项目的这个问题,将项目目录设置为我的脚本文件夹.

使用Python和Spyder,似乎没有任何解决方案.Spyder没有像Rstudio这样的功能.在进行交互式分析时(因为不可用),将目录设置为脚本的位置不起作用__file__.

怎么办,Python/Spyder中的工作目录是可重现的?

python spyder reproducible-research

13
推荐指数
3
解决办法
4万
查看次数

如何关闭"点击<返回>看下一个情节"提示plot3D?

persp3D在包中使用时plot3D,只产生了一个图,但我仍然必须响应"点击<返回>以查看下一个图"提示.有没有办法把它关掉?

更一般地,当多个地块,做包通常提供一种方式来指定一个特定的情节显示,类似which = c(1:3, 5)的争论plot.lm

plot r

12
推荐指数
2
解决办法
1万
查看次数

使用避难所导入Stata数据后访问变量标签的便捷方式

在R中,一些包(例如haven)将label属性插入变量(例如haven),这解释了变量的实质名称.例如,gdppc可能有标签GDP per capita.

这非常有用,尤其是从Stata导入数据时.但是,我仍然很难知道如何在我的工作流程中使用它.

  1. 如何快速浏览变量和变量标签?现在我必须这样做attributes(df$var),但这一点不太方便(la names(df))

  2. 如何在地块中使用这些标签?同样,我可以attr(df$var, "label")用来访问字符串标签.但是,这似乎很麻烦.

有没有官方的方法在工作流程中使用这些标签?我当然可以编写一个包装的自定义函数attr,但是当包以label不同方式实现属性时,它可能会在将来中断.因此,理想情况下,我想要一种由haven(或其他主要包)支持的官方方式.

label r stata r-haven

11
推荐指数
3
解决办法
5560
查看次数

SQL UNION 不检查匹配的列名——这取决于我吗?

我非常惊讶,UNION只是简单地连接行而不检查列名是否匹配。

例如,

SELECT 
    1 AS bar,
    2 AS foo

UNION ALL

SELECT 
    10 AS foo,
    20 AS bar
Run Code Online (Sandbox Code Playgroud)

产生

bar foo
1   2
10  20
Run Code Online (Sandbox Code Playgroud)

而我希望 SQL 会抱怨两个表中第一列的名称不同。

这是 SQL 的预期行为吗?如果是这样,对我来说这似乎是一个出现语义错误的巨大机会。我可以使用哪些方法来防止犯这种错误?对于UNION有很多列的大型系统,除了手动检查之外,如何确保列按相同顺序排列?

sql

11
推荐指数
1
解决办法
9106
查看次数

将数据从Google App Engine导出到csv

这个旧答案指向Google App Engine文档上的链接,但该链接现在是关于备份您的GAE数据,而不是下载它.

那么如何将所有数据下载到csv中呢?数据很小,即<1 GB

python csv google-app-engine

10
推荐指数
2
解决办法
6098
查看次数