小编Jor*_*dan的帖子

通过使用并行处理和/或plyr/dplyr来提高gDistance功能的速度/使用?

我为大约1000个人提供了大量的位置.总数据集大约为250万,我的处理脚本大约需要20个小时才能运行.然而,现在我有2400万观察,我需要清理我的代码,如果可以,我可能会使用并行处理.

对于每个点,我想找到最接近的多边形(大多数点不在多边形中)和该多边形的距离.这些点主要是在海上观测,而多边形是距离点最近的沿海(美国)县.

我一直在使用rgeos包中的gDistance函数执行此操作,并且已经运行了一系列循环(我知道,我知道),以便分解我的每个人的处理.我花了很多时间试图弄清楚如何将它移植到plyr/dplyr语法中,但不能完全得到它.我的问题的一部分,我假设我的对象类是SpatialPoint和SpatialPoylgonDataFrames.

library(sp)
library(rgeos)
library(plyr)
#  Create SpatialPointsDataFrame
#  My actual dataset has 24 million observations
my.pts <- data.frame(LONGITUDE=c(-85.4,-84.7,-82.7,-82.7,-86.5,-88.9,-94.8,-83.9,-87.8,-82.8),
             LATITUDE=c(30.0,29.9,27.5,28.5,30.4,26.1,29.3,28.0,29.4,27.8),
             MYID=c(1,1,2,2,2,2,3,4,4,4),
             INDEX=1:10)
coordinates(my.pts) <- c("LONGITUDE","LATITUDE")

#  Create two polygons in a SpatialPolygonsDataFrame
#  My actual dataset has 71 polygons (U.S. counties)
x1 <- data.frame(x=c(-92.3, -92.3, -90.7, -90.7, -92.3, -92.3),y=c(27.6, 29.4, 29.4, 27.6, 27.6, 27.6))
x1 <- as.data.frame(x1) 
x1 <- Polygon(rbind(x1,x1[1,]))

x2 <- data.frame(x=c(-85.2, -85.2, -83.3, -83.2, -85.2, -85.2),y=c(26.4, 26.9, 26.9, 26.0, 26.4,     26.4))
x2 <- as.data.frame(x2) 
x2 <- Polygon(rbind(x2,x2[1,])) …
Run Code Online (Sandbox Code Playgroud)

r spatial plyr r-sp

7
推荐指数
1
解决办法
996
查看次数

根据R中单行中的多个必需值匹配/查找行

这必须是重复但我找不到它.所以这里.

我有一个包含两列的data.frame.一个包含一个组,另一个包含一个标准.一个组可以包含许多不同的标准,但每行只能有一个标准.我想识别包含三个特定条件的组(但会出现在不同的行上.在​​我的情况下,我想识别包含标准"I","E","C"的所有组.组可以包含任何数字以及这些和其他几个字母的组合.

test <- data.frame(grp=c(1,1,2,2,2,3,3,3,4,4,4,4,4),val=c("C","I","E","I","C","E","I","A","C","I","E","E","A"))

> test
  grp val
1    1   C
2    1   I
3    2   E
4    2   I
5    2   C
6    3   E
7    3   I
8    3   A
9    4   C
10   4   I
11   4   E
12   4   E
13   4   A
Run Code Online (Sandbox Code Playgroud)

在上面的例子中,我想识别grp 2和4,因为每个都包含字母E,I和C.

谢谢!

r dataframe

5
推荐指数
1
解决办法
206
查看次数

R降价格式标题 - pdf输出

我确定这已经在那里,但我似乎无法找到它.如何在编译为pdf的R降价文档中更改标题的字体大小和间距?

谢谢!

pdf latex r r-markdown

4
推荐指数
1
解决办法
4233
查看次数

R Markdown 表格标题宽度与 kable 和 longtable

使用 R Markdown 输出 pdf。kable() 效果很好,但是当我添加longtable=T标题时,不再扩展表格的整个宽度。我似乎找不到一个可以控制此处标题详细信息的参数。我可以将标题移动到每个代码块的输出,但如果可能的话,我宁愿使用 kable 中的内置功能。

谢谢!

---
title: "test"
author: ""
date: "September 6, 2017"
output: 
pdf_document: 
latex_engine: xelatex
---

```{r setup, include=FALSE}
knitr::opts_chunk$set(echo = FALSE)
library(kableExtra)
library(knitr)
library(dplyr)
```

```{r table1}
test <- data.frame(col1=rep("MyLongWordsareLong",5),
               col2=rep("MyLongWordsareLong",5),
               col3=rep("MyLongWordsareLong",5),
               col4=rep("MyLongWordsareLong",5),
               col5=rep("MyLongWordsareLong",5),
               col6=rep("MyLongWordsareLong",5))

kable(test,format='latex',booktabs=TRUE,
caption="This is my example caption. See how, when I don't use 
longtable, it extends the full width of the table, but when I use the 
longtable option, it compresses down to only a portion …
Run Code Online (Sandbox Code Playgroud)

r longtable knitr r-markdown kableextra

4
推荐指数
1
解决办法
3999
查看次数

在 kable / kableExtra 中包含脚注和重复标题

当我包含kableExtra 中的repeat_header选项 ( kable_styling) 时,我丢失了脚注。我在帮助文件中看到kable_styling“可能有点棘手”。这是我正在经历的事情还是我缺少什么?在下面的代码中,我没有得到脚注。如果我删除 kable_styling,我会得到脚注。在我的真实情况中,我有一张长桌子,但据我所知, kable_styling 是罪魁祸首。

我今天刚刚用 github 版本更新了 kableExtra (9/18/17)

谢谢!

---
title: "Untitled"
output: 
pdf_document: 
latex_engine: xelatex
---

```{r setup, include=FALSE}
library(knitr)
library(kableExtra)
```

```{r cars,results='asis'}
kable(mtcars,format='latex',booktabs=TRUE,col.names=c("mpg","cyl[note]","disp","hp","drat","wt","qsec","vs","am","gear","carb"),
longtable=T,caption="This is my table caption") %>% 
 add_footnote(c("This is my footnote")) %>% 
 kable_styling(latex_options = c("repeat_header"))
```
Run Code Online (Sandbox Code Playgroud)

r kableextra kable

1
推荐指数
1
解决办法
5480
查看次数

标签 统计

r ×5

kableextra ×2

r-markdown ×2

dataframe ×1

kable ×1

knitr ×1

latex ×1

longtable ×1

pdf ×1

plyr ×1

r-sp ×1

spatial ×1