我为大约1000个人提供了大量的位置.总数据集大约为250万,我的处理脚本大约需要20个小时才能运行.然而,现在我有2400万观察,我需要清理我的代码,如果可以,我可能会使用并行处理.
对于每个点,我想找到最接近的多边形(大多数点不在多边形中)和该多边形的距离.这些点主要是在海上观测,而多边形是距离点最近的沿海(美国)县.
我一直在使用rgeos包中的gDistance函数执行此操作,并且已经运行了一系列循环(我知道,我知道),以便分解我的每个人的处理.我花了很多时间试图弄清楚如何将它移植到plyr/dplyr语法中,但不能完全得到它.我的问题的一部分,我假设我的对象类是SpatialPoint和SpatialPoylgonDataFrames.
library(sp)
library(rgeos)
library(plyr)
# Create SpatialPointsDataFrame
# My actual dataset has 24 million observations
my.pts <- data.frame(LONGITUDE=c(-85.4,-84.7,-82.7,-82.7,-86.5,-88.9,-94.8,-83.9,-87.8,-82.8),
LATITUDE=c(30.0,29.9,27.5,28.5,30.4,26.1,29.3,28.0,29.4,27.8),
MYID=c(1,1,2,2,2,2,3,4,4,4),
INDEX=1:10)
coordinates(my.pts) <- c("LONGITUDE","LATITUDE")
# Create two polygons in a SpatialPolygonsDataFrame
# My actual dataset has 71 polygons (U.S. counties)
x1 <- data.frame(x=c(-92.3, -92.3, -90.7, -90.7, -92.3, -92.3),y=c(27.6, 29.4, 29.4, 27.6, 27.6, 27.6))
x1 <- as.data.frame(x1)
x1 <- Polygon(rbind(x1,x1[1,]))
x2 <- data.frame(x=c(-85.2, -85.2, -83.3, -83.2, -85.2, -85.2),y=c(26.4, 26.9, 26.9, 26.0, 26.4, 26.4))
x2 <- as.data.frame(x2)
x2 <- Polygon(rbind(x2,x2[1,])) …Run Code Online (Sandbox Code Playgroud) 这必须是重复但我找不到它.所以这里.
我有一个包含两列的data.frame.一个包含一个组,另一个包含一个标准.一个组可以包含许多不同的标准,但每行只能有一个标准.我想识别包含三个特定条件的组(但会出现在不同的行上.在我的情况下,我想识别包含标准"I","E","C"的所有组.组可以包含任何数字以及这些和其他几个字母的组合.
test <- data.frame(grp=c(1,1,2,2,2,3,3,3,4,4,4,4,4),val=c("C","I","E","I","C","E","I","A","C","I","E","E","A"))
> test
grp val
1 1 C
2 1 I
3 2 E
4 2 I
5 2 C
6 3 E
7 3 I
8 3 A
9 4 C
10 4 I
11 4 E
12 4 E
13 4 A
Run Code Online (Sandbox Code Playgroud)
在上面的例子中,我想识别grp 2和4,因为每个都包含字母E,I和C.
谢谢!
我确定这已经在那里,但我似乎无法找到它.如何在编译为pdf的R降价文档中更改标题的字体大小和间距?
谢谢!
使用 R Markdown 输出 pdf。kable() 效果很好,但是当我添加longtable=T标题时,不再扩展表格的整个宽度。我似乎找不到一个可以控制此处标题详细信息的参数。我可以将标题移动到每个代码块的输出,但如果可能的话,我宁愿使用 kable 中的内置功能。
谢谢!
---
title: "test"
author: ""
date: "September 6, 2017"
output:
pdf_document:
latex_engine: xelatex
---
```{r setup, include=FALSE}
knitr::opts_chunk$set(echo = FALSE)
library(kableExtra)
library(knitr)
library(dplyr)
```
```{r table1}
test <- data.frame(col1=rep("MyLongWordsareLong",5),
col2=rep("MyLongWordsareLong",5),
col3=rep("MyLongWordsareLong",5),
col4=rep("MyLongWordsareLong",5),
col5=rep("MyLongWordsareLong",5),
col6=rep("MyLongWordsareLong",5))
kable(test,format='latex',booktabs=TRUE,
caption="This is my example caption. See how, when I don't use
longtable, it extends the full width of the table, but when I use the
longtable option, it compresses down to only a portion …Run Code Online (Sandbox Code Playgroud) 当我包含kableExtra 中的repeat_header选项 ( kable_styling) 时,我丢失了脚注。我在帮助文件中看到kable_styling“可能有点棘手”。这是我正在经历的事情还是我缺少什么?在下面的代码中,我没有得到脚注。如果我删除 kable_styling,我会得到脚注。在我的真实情况中,我有一张长桌子,但据我所知, kable_styling 是罪魁祸首。
我今天刚刚用 github 版本更新了 kableExtra (9/18/17)
谢谢!
---
title: "Untitled"
output:
pdf_document:
latex_engine: xelatex
---
```{r setup, include=FALSE}
library(knitr)
library(kableExtra)
```
```{r cars,results='asis'}
kable(mtcars,format='latex',booktabs=TRUE,col.names=c("mpg","cyl[note]","disp","hp","drat","wt","qsec","vs","am","gear","carb"),
longtable=T,caption="This is my table caption") %>%
add_footnote(c("This is my footnote")) %>%
kable_styling(latex_options = c("repeat_header"))
```
Run Code Online (Sandbox Code Playgroud)