小编ali*_*ire的帖子

Knitr提供的结果与RStudio不同

我正在使用'tm'和'RWeka'进行一些初始文本挖掘,使用Knitr进行再现.

我正在尝试基于两个文本文件获取语料库的术语 - 文档矩阵,当我在RStudio中运行代码并将其编织成HTML文件时,该过程有不同的结果: HTML文件

...当我尝试其他文档输出PDF和Word输出时:PDF和Word输出

同意RStudio.

而且,我需要一个HTML输出....

对可能发生的事情有任何想法?

这是.Rmd代码

---
title: "test"
author: "me"
output: word_document
---

```{r init, echo=FALSE, warning=FALSE, cache=TRUE, message=FALSE}
library(knitr)
library(tm)
library(SnowballC)
library(RWeka)
setwd("~")
options(mc.cores=1) # some problems with parallel processing
```
```{r 1-gram-test, echo=FALSE, eval=TRUE,cache=TRUE}

doc1 <- c("en un lugar de la mancha de cuyo nombre no quiero acordarme habitaba un hidalgo de los de adarga antigual, rocín flaco y galgo corredor")
doc2 <- c("había una vez un barquito chiquitito, que no sabía, …
Run Code Online (Sandbox Code Playgroud)

r knitr rweka

5
推荐指数
1
解决办法
1053
查看次数

从R的单个列中的所有数据中删除前缀

我将有一列数据如下所示:

M999-00001
M999-00002
...
Run Code Online (Sandbox Code Playgroud)

有没有办法删除R列中的所有'M'?

r prefix

5
推荐指数
1
解决办法
3607
查看次数

R:如何更改facet_grid中每行的列数

通过 ggplot,我使用下面的代码得到了如下图。但如果我这样绘图,我根本看不到 x 轴。我想知道是否有任何方法可以解决这个问题,例如更改每行中的列数。我已经尝试过ncol命令,facet_grid但它不允许我这样做。

ggplot(derivative, aes(x = factor(move), fill = factor(move)), colour = black)+ 
geom_bar()+
facet_grid(Market~Season)+
 scale_fill_discrete(name="Relative Market Move",
                  breaks=c("neg.big", "neg.small", "pos.big", "pos.small"),
                  labels=c("Big Negative", "Small Negative", "Big Positive", "Small Positive"))+
 scale_x_discrete(labels=c("Large Negative", "Small Negative", "large Positive", "Small Positive"))+
labs( x = "") +ylab("Count") 
Run Code Online (Sandbox Code Playgroud)

狭窄的多面情节

r ggplot2

5
推荐指数
1
解决办法
2968
查看次数

大地图的 Leaflet R 性能问题

我想知道在 R 中使用传单包绘制大量标记和多边形时是否有其他人遇到过类似的问题。这通常应该是这样的:

DMV地区少数民族人口热点图

但是,当我放大/缩小地图时,多边形和标记显然不合适(或者您可以说底图没有正确调整)。下面包含一个示例:

放大时相同的地图

当我绘制较小的区域或很少的标记时,我不会遇到这个问题。我想知道是否有办法提高性能。非常感谢您的帮助!

我的代码示例如下:

map1 <- leaflet() %>%
    addProviderTiles("CartoDB.Positron") %>%

    addPolygons(data = data_merged, group="Default",
                fillColor = ~pal(minority_population), color = "orange", 
                fillOpacity = 0.7,weight = 1, smoothFactor = 0.2, popup = popup) %>%

    addMarkers(data = branches_temp, ~long, ~lat,
               popup=~name_branch, group="Branch Locations",
               icon=icons(iconUrl = "./data/bank_blue_marker.png",iconWidth=20, iconHeight=20))
Run Code Online (Sandbox Code Playgroud)

gis r tigris census leaflet

5
推荐指数
0
解决办法
1561
查看次数

R zoo中的聚合函数返回错误

我每天都在使用这行代码很长一段时间,并在返回标准时间后出现问题.我试图用aggregate.zoo白天对每小时数据进行排名.我正在查看的数据期间不包括夏令时,所以我不明白这是什么问题.我正在使用这个zoo包.这是数据的结构:

require(zoo)

structure(c(15.52, 14.56, 14.31, 14.17, 13.75, 15.3, 25.57, 25.39, 
23.43, 22.92, 23.31, 23.44, 22.09, 21.28, 21, 20.94, 27.16, 32.73, 
33.74, 29.12, 24.78, 21.44, 18.95, 17.08, 17.9, 17.54, 16.45, 
16.59, 16.09, 17.23, 25.31, 25.43, 24.93, 24.47, 23.69, 21.53, 
19.61, 19.53, 19.38, 19.38, 24.59, 29.03, 30.02, 23.78, 20.44, 
21.39, 18.79, 21.7, 20.5, 20.63, 18.57, 19.41, 19.2, 15.23, 23.48, 
24.89, 24.79, 24.01, 23.18, 22.5, 20.88, 21.12, 20, 20.55, 27.83, 
31.21, 28.29, 26.1, 23.31, 21.64, 18.19, 17.28, 17.87, 17.63, …
Run Code Online (Sandbox Code Playgroud)

aggregate r rank zoo

5
推荐指数
1
解决办法
145
查看次数

在嵌套数据框中使用`map()`

我在使用map()函数和nest()函数时遇到了一些问题.

我有一些数据设置如下:

counter

    counter           date_time total
1  06032013 2013-06-03 16:00:00   476
2  06032013 2013-06-03 17:00:00   578
3  06032013 2013-06-03 18:00:00   406
4  06032013 2013-06-03 19:00:00   272
5  06032013 2013-06-03 20:00:00   240
6  06032013 2013-06-03 21:00:00    96
7  06032013 2013-06-03 22:00:00    67
8  06032013 2013-06-03 23:00:00    37
9  06032013 2013-06-04 00:00:00    10
10 06032013 2013-06-04 01:00:00    11
11 06032013 2013-06-04 02:00:00     8
12 06032013 2013-06-04 03:00:00     9
13 06032013 2013-06-04 04:00:00    23
14 06032013 2013-06-04 05:00:00    83 …
Run Code Online (Sandbox Code Playgroud)

r xts dplyr tidyr purrr

5
推荐指数
1
解决办法
2131
查看次数

使用 summarise() 函数时出现 NA 的标准偏差

我正在尝试计算birthwt在 RStudio 中找到的出生体重数据集 ( ) 的描述性统计数据。不过,我只关心几个变量:ageftvptllwt

这是我到目前为止的代码:

library(MASS)
library(dplyr)
data("birthwt")

grouped <- group_by(birthwt, age, ftv, ptl, lwt)

summarise(grouped, 
          mean = mean(bwt),
          median = median(bwt),
          SD = sd(bwt))
Run Code Online (Sandbox Code Playgroud)

它给了我一张印刷精美的表格,但只有有限数量的 SD 被填满,其余的说NA. 我就是不知道为什么或如何解决它!

r standard-deviation dplyr

5
推荐指数
2
解决办法
3843
查看次数

使用 expression() 在 R 中标记时如何制作连字符而不是减号?

expression()在我的绘图的 x 轴标签中使用在我的度量名称上创建一个平方根符号,以指示数据已使用平方根转换进行了转换。但是,我的度量名称(“CES-D”)中有一个连字符。当我把它写在 中时expression(),连字符变成一个减号或短划线字符,周围有空格。

qplot(1:10, 1:10) + 
    labs(x = expression(sqrt(CES-D~scores)), 
         y = "CES-D scores")
Run Code Online (Sandbox Code Playgroud)

x 和 y 轴标签中的连字符不同

请注意,x 轴和 y 轴标签中的连字符是不同的。在 x 轴标签中,它看起来像“CES 减去 D 分数”的平方根。

如何在expression()for 文本中创建常规连字符?

label r ggplot2 plotmath

5
推荐指数
1
解决办法
1997
查看次数

dplyr 领先/落后于 group_by

不明白为什么我的超前和滞后功能忽略了group by。这是一个简单的例子(实际上我需要按 5 列分组)。?

# Dummy DataSet
df <- data.frame(group = c("a","a","a","a", "a", "b", "b", "b", "b", "b"),
                 order = c(3, 4, 2, 5, 1, 1, 3, 4, 2, 4),
                 value = c(15, 22, 43, 31, 25, 11, 37, 24, 18, 9))    

"group" "order" "value"
"a" 3   15
"a" 4   22
"a" 2   43
"a" 5   31
"a" 1   25
"b" 1   11
"b" 3   37
"b" 4   24
"b" 2   18
"b" 4   9
Run Code Online (Sandbox Code Playgroud)

试过这个,但即使是 order by 在这里也不起作用

df …
Run Code Online (Sandbox Code Playgroud)

r lead dplyr

5
推荐指数
0
解决办法
1417
查看次数

按纬度区间划分的栅格汇总统计

R 中是否有一种快速方法可以根据纬度间隔或箱对栅格进行汇总统计。不是整个栅格图层的摘要,而是空间分段的摘要。例如,获取纬度每两度的栅格像元值的平均值和标准差。

下面是带有纬度/经度坐标的投影栅格的一些示例数据。

set.seed(2013)
library(raster)

r <- raster(xmn=-110, xmx=-90, ymn=40, ymx=60, ncols=40, nrows=40)
r <- setValues(r, rnorm(1600)) #add values to raster
r[r > -0.2 & r < 0.2] <- NA #add some NA's to resemble real dataset
plot(r)

> r
class       : RasterLayer 
dimensions  : 40, 40, 1600  (nrow, ncol, ncell)
resolution  : 0.5, 0.5  (x, y)
extent      : -110, -90, 40, 60  (xmin, xmax, ymin, ymax)
coord. ref. : +proj=longlat +datum=WGS84 +ellps=WGS84 +towgs84=0,0,0 
data source : in memory
names …
Run Code Online (Sandbox Code Playgroud)

r raster subset geospatial r-raster

5
推荐指数
1
解决办法
325
查看次数