我正在使用'tm'和'RWeka'进行一些初始文本挖掘,使用Knitr进行再现.
我正在尝试基于两个文本文件获取语料库的术语 - 文档矩阵,当我在RStudio中运行代码并将其编织成HTML文件时,该过程有不同的结果: 
...当我尝试其他文档输出PDF和Word输出时:
同意RStudio.
而且,我需要一个HTML输出....
对可能发生的事情有任何想法?
这是.Rmd代码
---
title: "test"
author: "me"
output: word_document
---
```{r init, echo=FALSE, warning=FALSE, cache=TRUE, message=FALSE}
library(knitr)
library(tm)
library(SnowballC)
library(RWeka)
setwd("~")
options(mc.cores=1) # some problems with parallel processing
```
```{r 1-gram-test, echo=FALSE, eval=TRUE,cache=TRUE}
doc1 <- c("en un lugar de la mancha de cuyo nombre no quiero acordarme habitaba un hidalgo de los de adarga antigual, rocín flaco y galgo corredor")
doc2 <- c("había una vez un barquito chiquitito, que no sabía, …Run Code Online (Sandbox Code Playgroud) 通过 ggplot,我使用下面的代码得到了如下图。但如果我这样绘图,我根本看不到 x 轴。我想知道是否有任何方法可以解决这个问题,例如更改每行中的列数。我已经尝试过ncol命令,facet_grid但它不允许我这样做。
ggplot(derivative, aes(x = factor(move), fill = factor(move)), colour = black)+
geom_bar()+
facet_grid(Market~Season)+
scale_fill_discrete(name="Relative Market Move",
breaks=c("neg.big", "neg.small", "pos.big", "pos.small"),
labels=c("Big Negative", "Small Negative", "Big Positive", "Small Positive"))+
scale_x_discrete(labels=c("Large Negative", "Small Negative", "large Positive", "Small Positive"))+
labs( x = "") +ylab("Count")
Run Code Online (Sandbox Code Playgroud)
我想知道在 R 中使用传单包绘制大量标记和多边形时是否有其他人遇到过类似的问题。这通常应该是这样的:

但是,当我放大/缩小地图时,多边形和标记显然不合适(或者您可以说底图没有正确调整)。下面包含一个示例:

当我绘制较小的区域或很少的标记时,我不会遇到这个问题。我想知道是否有办法提高性能。非常感谢您的帮助!
我的代码示例如下:
map1 <- leaflet() %>%
addProviderTiles("CartoDB.Positron") %>%
addPolygons(data = data_merged, group="Default",
fillColor = ~pal(minority_population), color = "orange",
fillOpacity = 0.7,weight = 1, smoothFactor = 0.2, popup = popup) %>%
addMarkers(data = branches_temp, ~long, ~lat,
popup=~name_branch, group="Branch Locations",
icon=icons(iconUrl = "./data/bank_blue_marker.png",iconWidth=20, iconHeight=20))
Run Code Online (Sandbox Code Playgroud) 我每天都在使用这行代码很长一段时间,并在返回标准时间后出现问题.我试图用aggregate.zoo白天对每小时数据进行排名.我正在查看的数据期间不包括夏令时,所以我不明白这是什么问题.我正在使用这个zoo包.这是数据的结构:
require(zoo)
structure(c(15.52, 14.56, 14.31, 14.17, 13.75, 15.3, 25.57, 25.39,
23.43, 22.92, 23.31, 23.44, 22.09, 21.28, 21, 20.94, 27.16, 32.73,
33.74, 29.12, 24.78, 21.44, 18.95, 17.08, 17.9, 17.54, 16.45,
16.59, 16.09, 17.23, 25.31, 25.43, 24.93, 24.47, 23.69, 21.53,
19.61, 19.53, 19.38, 19.38, 24.59, 29.03, 30.02, 23.78, 20.44,
21.39, 18.79, 21.7, 20.5, 20.63, 18.57, 19.41, 19.2, 15.23, 23.48,
24.89, 24.79, 24.01, 23.18, 22.5, 20.88, 21.12, 20, 20.55, 27.83,
31.21, 28.29, 26.1, 23.31, 21.64, 18.19, 17.28, 17.87, 17.63, …Run Code Online (Sandbox Code Playgroud) 我在使用map()函数和nest()函数时遇到了一些问题.
我有一些数据设置如下:
counter
counter date_time total
1 06032013 2013-06-03 16:00:00 476
2 06032013 2013-06-03 17:00:00 578
3 06032013 2013-06-03 18:00:00 406
4 06032013 2013-06-03 19:00:00 272
5 06032013 2013-06-03 20:00:00 240
6 06032013 2013-06-03 21:00:00 96
7 06032013 2013-06-03 22:00:00 67
8 06032013 2013-06-03 23:00:00 37
9 06032013 2013-06-04 00:00:00 10
10 06032013 2013-06-04 01:00:00 11
11 06032013 2013-06-04 02:00:00 8
12 06032013 2013-06-04 03:00:00 9
13 06032013 2013-06-04 04:00:00 23
14 06032013 2013-06-04 05:00:00 83 …Run Code Online (Sandbox Code Playgroud) 我正在尝试计算birthwt在 RStudio 中找到的出生体重数据集 ( ) 的描述性统计数据。不过,我只关心几个变量:age,ftv,ptl和lwt。
这是我到目前为止的代码:
library(MASS)
library(dplyr)
data("birthwt")
grouped <- group_by(birthwt, age, ftv, ptl, lwt)
summarise(grouped,
mean = mean(bwt),
median = median(bwt),
SD = sd(bwt))
Run Code Online (Sandbox Code Playgroud)
它给了我一张印刷精美的表格,但只有有限数量的 SD 被填满,其余的说NA. 我就是不知道为什么或如何解决它!
我expression()在我的绘图的 x 轴标签中使用在我的度量名称上创建一个平方根符号,以指示数据已使用平方根转换进行了转换。但是,我的度量名称(“CES-D”)中有一个连字符。当我把它写在 中时expression(),连字符变成一个减号或短划线字符,周围有空格。
qplot(1:10, 1:10) +
labs(x = expression(sqrt(CES-D~scores)),
y = "CES-D scores")
Run Code Online (Sandbox Code Playgroud)
请注意,x 轴和 y 轴标签中的连字符是不同的。在 x 轴标签中,它看起来像“CES 减去 D 分数”的平方根。
如何在expression()for 文本中创建常规连字符?
不明白为什么我的超前和滞后功能忽略了group by。这是一个简单的例子(实际上我需要按 5 列分组)。?
# Dummy DataSet
df <- data.frame(group = c("a","a","a","a", "a", "b", "b", "b", "b", "b"),
order = c(3, 4, 2, 5, 1, 1, 3, 4, 2, 4),
value = c(15, 22, 43, 31, 25, 11, 37, 24, 18, 9))
"group" "order" "value"
"a" 3 15
"a" 4 22
"a" 2 43
"a" 5 31
"a" 1 25
"b" 1 11
"b" 3 37
"b" 4 24
"b" 2 18
"b" 4 9
Run Code Online (Sandbox Code Playgroud)
试过这个,但即使是 order by 在这里也不起作用
df …Run Code Online (Sandbox Code Playgroud) R 中是否有一种快速方法可以根据纬度间隔或箱对栅格进行汇总统计。不是整个栅格图层的摘要,而是空间分段的摘要。例如,获取纬度每两度的栅格像元值的平均值和标准差。
下面是带有纬度/经度坐标的投影栅格的一些示例数据。
set.seed(2013)
library(raster)
r <- raster(xmn=-110, xmx=-90, ymn=40, ymx=60, ncols=40, nrows=40)
r <- setValues(r, rnorm(1600)) #add values to raster
r[r > -0.2 & r < 0.2] <- NA #add some NA's to resemble real dataset
plot(r)
> r
class : RasterLayer
dimensions : 40, 40, 1600 (nrow, ncol, ncell)
resolution : 0.5, 0.5 (x, y)
extent : -110, -90, 40, 60 (xmin, xmax, ymin, ymax)
coord. ref. : +proj=longlat +datum=WGS84 +ellps=WGS84 +towgs84=0,0,0
data source : in memory
names …Run Code Online (Sandbox Code Playgroud)