最近,Edwin Chen发布了一张关于苏打水与流行的区域使用情况以及通过地理编码推文在饮酒方面解决这些词语的焦炭的精彩地图.http://blog.echen.me/2012/07/06/soda-vs-pop-with-twitter/
他提到,他所使用的杰夫·金特里在R.果然创建Twitter的包,很容易收集使用给定词的鸣叫,把他们在一个数据帧:
require(twitteR)
require(plyr)
cat.tweets<-searchTwitter("cats",n=1000)
tweets.df = ldply(cat.tweets, function(t) t$toDataFrame() )
Run Code Online (Sandbox Code Playgroud)
dataframe(tweets.df)将包含每条推文的用户ID,推文文本等,但似乎不包含地理编码.关于如何在R中获得它的任何想法?
我正在研究Rstudio中的降价文档,比较Perl和R.我希望能够做的是根据使用的语言有不同的代码块背景颜色.例如
R代码块
```{r}
dog <- 1
cat <- 2
dog + cat
```
Run Code Online (Sandbox Code Playgroud)
Perl代码块
```{r, engine='perl'}
$dog = 1;
$cat = 2;
print $dog + $cat;
```
Run Code Online (Sandbox Code Playgroud)
如果使用带有上述代码的knitr生成html文件,则r代码块具有纯灰色背景,而代码块的输出具有白色/透明背景.
但是,Perl代码块和输出具有白色/透明背景,看起来令人困惑.我希望在markdown/knitr中有一种优雅的方式来做到这一点.
我一直在使用"nlme"包中的R Orthodont数据集.只是用来install.packages("nlme");library(nlme);head(Orthodont)看看.该数据集包括在27名儿童中随时间测量的垂体和翼状颌裂之间的距离.
使用lme4包我可以使用逻辑曲线作为我的函数形式拟合非线性混合效应模型.我可以选择将渐近线和中点作为随机效果输入
nm1 <- nlmer(distance ~ SSlogis(age,Asym, xmid, scal) ~ (Asym | Subject) + (xmid | Subject), Orthodont, start = c(Asym =25,xmid = 11, scal = 3), corr = FALSE,verb=1)
Run Code Online (Sandbox Code Playgroud)
我真正想知道的是性别是否会改变这些参数.不幸的是,在线示例不包括主题和组示例.这是否可以使用lme4包装?
传统上,线性混合效应模型是按以下方式制定的。Ri = Xi×?+ Zi×bi +?i在哪里?代表估计的固定效应,Z代表随机效应。因此,X是经典设计矩阵。使用R,在使用nlme包中的lme拟合模型后,我希望能够提取这两个矩阵。例如,也可以在nlme软件包中找到的数据集“ Rails”包含在6条随机选择的铁路轨道上的三个超声行进时间的单独测量值。我可以通过以下方法为每个轨道设置截距固定效果和随机效果的简单模型。
library(nlme)
lmemodel<-lme(travel ~ 1, random = ~ 1 | Rail, data=Rail)
Run Code Online (Sandbox Code Playgroud)
X设计矩阵只是一个18x1矩阵(6个滑轨* 3个测量值)的单位,并且可以通过以下方式轻松提取:
model.matrix(lmemodel, data=Rail)
(Intercept)
1 1
2 1
3 1
4 1
5 1
6 1
7 1
8 1
9 1
10 1
11 1
12 1
13 1
14 1
15 1
16 1
17 1
18 1
attr(,"assign")
[1] 0
Run Code Online (Sandbox Code Playgroud)
我想做的是提取随机效果设计矩阵Z。我意识到,如果我使用lme4包拟合相同的模型,则可以通过以下方式完成:
library(lme4)
lmermodel<-lmer(travel ~ 1 + (1|Rail),data=Rail)
t(lmermodel@Zt) ##takes the transpose of lmermodel@Zt
lmermodel@X ## extracts the X matrix …Run Code Online (Sandbox Code Playgroud) 我有这样的数据,即一个主题在不同的日子(以 POSIXct 格式)获得分数。
head(test)
Date Subject score
1 2012-08-10 Black6 0
2 2012-08-11 Black6 0
3 2012-08-12 Black6 0
4 2012-08-13 Black6 0
5 2012-08-14 Black6 0
6 2012-08-15 Black6 0
Run Code Online (Sandbox Code Playgroud)
拟合黄土曲线很简单。
ggplot(test,aes(Date,score))+geom_smooth()+geom_point()
Run Code Online (Sandbox Code Playgroud)
我想做的是拟合三阶多项式线。如果我输入以下内容,则会出现错误:
ggplot(test,aes(Date,score))+stat_smooth(method = "lm", formula = score ~ poly(Date, 3), size = 1)+geom_point()
Error in eval(expr, envir, enclos) : object 'score' not found
Run Code Online (Sandbox Code Playgroud)
如果我在 stat_smooth() 中将 Date 指定为数字,我会得到同样的错误。有没有办法在 ggplot 中做到这一点?
这是数据:
test<-structure(list(Date = structure(c(1344556800, 1344643200, 1344729600,
1344816000, 1344902400, 1344988800, 1345075200, 1345161600, 1345248000,
1345334400, 1345420800, 1345507200, 1345593600, 1345680000, …Run Code Online (Sandbox Code Playgroud) r ×5
lme4 ×2
geocode ×1
ggplot2 ×1
knitr ×1
mixed-models ×1
nlme ×1
r-markdown ×1
rstudio ×1
twitter ×1