我试图使用map()的purrr包装应用filter()功能,存储在嵌套数据帧中的数据.
"你为什么不先过滤,然后窝? - 你可能会问.这会起作用(我会用这样的过程显示我想要的结果),但我正在寻找方法来做到这一点purrr.我想要只有一个数据框,有两个列表列,都是嵌套数据帧 - 一个是完整的,一个是过滤的.
我现在可以通过执行nest()两次来实现它:一次打开所有数据,第二次打开过滤数据:
library(tidyverse)
df <- tibble(
a = sample(x = rep(c('x','y'),5), size = 10),
b = sample(c(1:10)),
c = sample(c(91:100))
)
df_full_nested <- df %>%
group_by(a) %>%
nest(.key = 'full')
df_filter_nested <- df %>%
filter(c >= 95) %>% ##this is the key step
group_by(a) %>%
nest(.key = 'filtered')
## Desired outcome - one data frame with 2 nested list-columns: one full and one filtered.
## …Run Code Online (Sandbox Code Playgroud) 当在 Rmarkdown 文档的 YAML 部分声明输出格式时,有没有办法确保它编织成 PDF,但看起来像编织的 HTML?
knitted PDF 看起来完全不一样:字体是某种衬线字体(假设我可以更改它),块引用和代码块看起来不同。
我喜欢针织 HTML 和外观,但是有没有办法生成看起来完全相同的 PDF?
作为例子,只是一个简单的默认示例代码:
---
title: "Untitled"
output:
html_document: default
pdf_document: default
---
```{r setup, include=FALSE}
knitr::opts_chunk$set(echo = TRUE)
```
## R Markdown
This is an R Markdown document. Markdown is a simple formatting syntax for authoring HTML, PDF, and MS Word documents. For more details on using R Markdown see <http://rmarkdown.rstudio.com>.
> This is a quote
This is a link: <http://rmarkdown.rstudio.com>
When you click the **Knit** button a …Run Code Online (Sandbox Code Playgroud) 我正在运行静态blogdown站点并将其部署在Netlify上.我在GitHub上源文件,Hugo构建网站,Netlify部署它.
Netlify报告该站点是活动的(部署日志包含在底部),但是当我尝试查看我的站点时,我看到的只是Netlify错误消息:
网页未找到
您似乎已经关注了断开的链接或输入了此网站上不存在的网址.
←返回我们的网站
可能是什么原因?
我的GitHub回购:https://github.com/taraskaduk/taraskaduk
我的URL应该是网站:https://taraskaduk.com/
我的部署设置:
Repository: https://github.com/taraskaduk/taraskaduk
Build command: hugo
Publish directory: public
Production branch: master
Branch deploys: Deploy only the production branch and its deploy previews
Public deploy logs: Logs are public
Run Code Online (Sandbox Code Playgroud)
雨果版(我试过不同的版本)
HUGO_VERSION 0.37.1
我最新的部署日志:
9:56:27 PM: Build ready to start
9:56:28 PM: Fetching cached dependencies
9:56:29 PM: Starting to download cache of 172.4MB
9:56:30 PM: Finished downloading cache in 1.74774892s
9:56:30 PM: Starting to extract …Run Code Online (Sandbox Code Playgroud) 哪个参数在哪个config.toml或哪个文件/layouts控制生成index.xml?
当我验证我的Atom提要时,我收到了一些错误,几乎所有错误都归因于链接不是完整链接.
https://validator.w3.org/feed/check.cgi?url=https%3A%2F%2Ftaraskaduk.com%2Findex.xml
例:
<title>My first shiny app: calculating your hourly rate as a consultant</title>
<link>/post/2018-01-shiny-rate/shiny_rate/</link>
<pubDate>Sat, 13 Jan 2018 00:00:00 +0000</pubDate>
Run Code Online (Sandbox Code Playgroud)
我理解要求提供完整的链接,即 https://taraskaduk.com/post/2018-01-shiny-rate/shiny_rate/
我该如何控制?
还有,有没有办法将整个帖子传递给Atom,而不仅仅是描述?
有很多方法可以将数据帧转换为Markdown表。但是在给定Markdown表的情况下,如何将其转换回数据框
给定一个表格表格:
Table Header | Second Header
------------- | -------------
Table Cell | Cell 2
Cell 3 | Cell 4
Run Code Online (Sandbox Code Playgroud)
或者,甚至更糟的是,
Table Header | Second Header \n------------- | ------------- \nTable Cell | Cell 2 \nCell 3 | Cell 4
Run Code Online (Sandbox Code Playgroud)
如何将其放入数据帧?
如何median对已经聚合的数据进行适当的计算?
说我有一个看起来像这样的数据框
> df <- data_frame(name = c("A","B","C","D"), count = c(1,3,5,2), avg = c(100,50,20,10))
> df
# A tibble: 4 × 3
name count avg
<chr> <dbl> <dbl>
1 A 1 100
2 B 3 50
3 C 5 20
4 D 2 10
Run Code Online (Sandbox Code Playgroud)
假设我们对垃圾桶中的东西了解不多,但是假设垃圾桶中的变化很小。据我们所知,我们将像这样排列值:
10 10 20 20 20 20 20 50 50 50 100
Run Code Online (Sandbox Code Playgroud)
在11个值中,中位数将是第6个值,即20
但是,如果我简单地采用median(),则R会接受4个值:10, 20, 50, 100
> median(df$avg)
[1] 35
Run Code Online (Sandbox Code Playgroud)
这不是我想要的。
如何解决这个问题并“展开”数据集?