小编Del*_*aIV的帖子

更改RMarkdown HTML输出中图形标题的字体大小

我想让我的R Markdown文档中所有图形标题的字体大小变小.最终的输出是HTML,我在R Studio工作.为了加载图片,我使用了include_graphics函数from knitr,因为我被告知这是最好的方法(见这里).我的.Rmd文件是:

---
title: "ppp"
author: "ppp"
date: "July 4, 2017"
output: 
  html_document: 
    fig_caption: yes
---

```{r setup, include=FALSE}
library(knitr)
opts_chunk$set(echo = FALSE)
```


```{r foo, fig.cap="$f_{p}$ as a function of $g$ for various values of $r=\\frac{\\rho_{w}}{\\rho_{a}}$"}
# All defaults
include_graphics("download.jpg")
``` 

This is regular text.
Run Code Online (Sandbox Code Playgroud)

相应的输出是: 在此输入图像描述

如您所见,标题字体大小和常规文本字体大小完全相同,看起来不太好.我怎么解决这个问题?

html r knitr r-markdown

6
推荐指数
1
解决办法
3246
查看次数

使用 RStudio 将 RMarkdown 编织为 HTML 时,是否可以直接在浏览器中查看,而不是在窗口中预览?

我经常使用大量数学的 RMarkdown 文档,例如:

---
title: "Just a test"
author: "Yours Truly"
date: '`r Sys.Date()`'
output:
  html_document:
    fig_caption: yes
---

```{r setup, include=FALSE}
library(knitr)
opts_chunk$set(echo  = FALSE,
               cache = TRUE,
               out.width = "75%", 
               fig.align = "center")
```

## Classical multiple linear regression
A common question in Data Science/Statistics is: how does a certain quantity $y$ depend on other quantities $x_1,\dots,x_p$? Generally, we are interested in $p(y|\mathbf{x})$, the conditional distribution of $y$ given $\mathbf{x}=(x_1,\dots,x_p)$. The simplest and perhaps most widely used model …
Run Code Online (Sandbox Code Playgroud)

html rstudio r-markdown

6
推荐指数
0
解决办法
429
查看次数

如何合并 Jupyter 笔记本中的更改

与同事在 Jupyter 笔记本上进行协作让我抓狂。我们正在开发同一笔记本的不同版本(我会说“分支”,但这对于我们正在做的事情来说可能太花哨了)。我尝试将他引入的(一些)更改合并到我的版本中。由于比较 JSON 文件是一场噩梦,因此我将两个笔记本转换为.py文件(从笔记本的文件菜单下载为\Python(.py 文件)),然后在 PyCharm 中比较文件。这很好用,还因为导出到..py.py

现在的问题是将更改后的.py文件导入到 Jupyter 中。这可能吗?让我希望得到肯定答案的一件事是,导出的.py文件中有一些# In[4]:注释,Jupyter 界面可能会使用这些注释来理解代码如何划分为单元格。还是根本不可能回去?如果是这样,您还有其他建议来合并 Jupyter 笔记本的两个不同版本之间的一些更改吗?

python merge jupyter-notebook

6
推荐指数
1
解决办法
1万
查看次数

Windows 中更快的 R 实现

最近我一直在做很多线性代数重的东西,我发现我可信赖的 CRAN R 在挣扎,所以我寻找一些方法来获得更好的性能。但是,在 Windows 下获得它似乎并不容易。由于我有一台 Intel 机器,我想针对 Intel MKL Math 库而不是标准 BLAS 编译 R。我发现这个:相对简单,但页面末尾对 Red Hat Linux 的引用引起了怀疑。这是正确的,因为如果您在 R 管理手册中查找 MKL 条目,您会发现显然针对 MKL 编译 R 在 Windows 中不起作用。如果在 Windows 下尝试使用 ATLAS,也会出现类似的问题。因此,令我非常遗憾的是,我决定放弃 CRAN R 并转向Microsoft R Open. 为这个 R 发行版安装 MKL 非常简单,而且效果很好。因此我想知道:在 Windows 下是否还有其他 R 发行版或实现,它们在线性代数计算方面始终比 CRAN R 快?它们是否通用?你使用它们中的任何一个吗?

windows r blas

5
推荐指数
0
解决办法
922
查看次数

为 Python 代码构建调用树

我获得了 Python 代码及其导入的模块。我想建立一棵树来指示哪个函数调用其他函数。我怎样才能做到这一点?

python function call-graph

5
推荐指数
1
解决办法
5563
查看次数

获取字典的随机子集

免责声明:我知道有一个问题叫做

获取 dict 的随机样本

但很明显,我的不是重复的。该问题的答案主要集中在计算字典的随机子集的值的总和,因为这正是 OP 真正想要的。相反,我真的需要提取一个子集。

我有一个非常大的字典,我想提取一个子样本,然后我想对其进行迭代。我试过:

import random
dictionary = {'a':1, 'b':2, 'c':3, 'd':4, 'e':5}
keys = random.sample(dictionary, 3)
sample = dictionary[keys]
Run Code Online (Sandbox Code Playgroud)

但它不起作用:

Traceback (most recent call last):
  File "[..]/foobar.py", line 4, in <module>
    sample = dictionary[keys]
TypeError: unhashable type: 'list'
Run Code Online (Sandbox Code Playgroud)

这有效:

import random
dictionary = {'a':1, 'b':2, 'c':3, 'd':4, 'e':5}
keys = random.sample(dictionary, 3)
sample = {key: dictionary[key] for key in keys}
Run Code Online (Sandbox Code Playgroud)

这似乎有点词性:我希望有一种矢量化的方式来构建新词典。但是,这是正确/最 Pythonic 的方法吗?另外,如果我想迭代这个样本,我应该这样做:

for key, value in sample.iteritems():
    print(key, value)
Run Code Online (Sandbox Code Playgroud)

我的问题不是重复

如何在字典python中随机选择多个键及其值 …

python random dictionary

5
推荐指数
1
解决办法
2644
查看次数

更改skim打印汇总函数的顺序

我正在使用skimr,并且将两个汇总函数(iqr_na_rmmedian_na_rm)添加到该函数的汇总函数列表中skim。但是,默认情况下,这些新的汇总函数(skimmersskimr文档中调用)出现在表的末尾。相反,我希望 medianiqr出现在mean和之后sd之后。

.Rmd最终目标是在如下报告中显示结果:

---
title: "Test"
output: html_document
---

```{r setup, include=FALSE}
knitr::opts_chunk$set(warning = FALSE, 
                      message = FALSE,
                      echo    = FALSE)
```

## Test

```{r test, results = 'asis'}
library(skimr)
library(dplyr)
library(ggplot2)

iqr_na_rm <- function(x) IQR(x, na.rm = TRUE)
median_na_rm <- function(x) median(x, na.rm = TRUE)

skim_with(numeric = list(p50 = NULL, median = median_na_rm, iqr = iqr_na_rm),
          integer = list(p50 …
Run Code Online (Sandbox Code Playgroud)

printing r summary r-markdown skimr

5
推荐指数
1
解决办法
612
查看次数

将极坐标数据框中的列组合并为单列

我有一个带有 columns 的极坐标数据框a_0, a_1, a_2, b_0, b_1, b_2。我想将其转换为更长更薄的数据框(3 x 行,但只有 2 列ab),因此a包含a_0[0], a_1[0], a_2[0], a_0[1], a_1[1], a_2[1],...和 相同b。我怎样才能做到这一点?

python reshape python-polars

5
推荐指数
1
解决办法
97
查看次数

R - 具有估计标准误差的线性回归的 k 倍交叉验证

我想在 R 中对线性回归模型执行 k 折交叉验证并测试一个标准误差规则:

https://stats.stackexchange.com/questions/17904/one-standard-error-rule-for-variable-selection

因此,我需要一个函数,它可以返回预测误差的交叉验证估计该估计的标准误差(或者至少是每次折叠的 MSE,以便我可以自己计算标准误差)。许多包都有计算交叉验证误差的函数(例如,cv.glmboost包中),但通常它们仅返回预测误差的 CV 估计,而不返回其标准误差或每次折叠的 MSE。

我尝试使用 package DAAG,它的函数CVlm应该提供比cv.glm. 但是,我似乎无法让它发挥作用!这是我的代码:

a=c(0.0056, 0.0088, 0.0148, 0.0247, 0.0392, 0.0556, 0.0632, 0.0686, 0.0786, 0.0855, 0.0937)
b=c(6.0813, 9.5011, 15.5194, 23.9409, 32.8492, 40.8399, 43.8760, 45.5270, 46.7668, 46.1587, 43.4524)
dataset=data.frame(x=a,y=b)
CV.list=CVlm(df=dataset,form.lm = formula(y ~ poly(x,2)), m=5)
Run Code Online (Sandbox Code Playgroud)

我得到了几乎没有信息的错误

Error in xy.coords(x, y, xlabel, ylabel, log) : 
'x' and 'y' lengths differ 
Run Code Online (Sandbox Code Playgroud)

这对我来说没有多大意义。xy的长度相同 (11),因此很明显该函数正在抱怨它内部创建的其他一些x变量y

我很乐意接受其他软件包的解决方案(例如 …

r standard-error linear-regression cross-validation r-caret

4
推荐指数
1
解决办法
4559
查看次数

从字符串中提取子字符串,以及字符串的其余部分

我想将字符串的第一个字符存储在变量中,将其余字符串存储在另一个变量中.例如:

x <- "foo"
prefix <- substr(x, 1, 1)
suffix <- substring(x, 2)
Run Code Online (Sandbox Code Playgroud)

然而,打电话substr和打电话似乎有点浪费substring.有没有办法同时提取子字符串和字符串的其余部分(子字符串和原始字符串之间的"差异")?

string r substr

4
推荐指数
1
解决办法
154
查看次数