在Hadley Wickham的第10.3章中的ggplot2一书中,他提到了制作情节功能.我想制作许多使用刻面的类似图,但我不能引用列.如果我的所有引用都是美学的,那么我可以使用aes_string,一切正常.Facet_wrap似乎没有类似的东西.
library(ggplot2)
data(iris)
Run Code Online (Sandbox Code Playgroud)
这是我想要功能化的情节.
pl.flower1 <- ggplot(data=iris,
aes_string(x='Sepal.Length', y='Sepal.Width', color='Petal.Length')) +
geom_point() +facet_wrap(~Species)
Run Code Online (Sandbox Code Playgroud)
如果我不这样做,这是有效的.
flowerPlot <- function(dat, sl, sw, pl, sp){
ggplot(data=dat, aes_string(x=sl, y=sw, color=pl)) + geom_point()
}
pl.flower2 <- flowerPlot(iris, sl='Sepal.Length', sw='Sepal.Width', pl='Petal.Length')
Run Code Online (Sandbox Code Playgroud)
"sp"应该是下面的两行?一个公式,一个字符串?也许整个方法都是错误的.
flowerPlotWrap <- function(dat, sl, sw, pl, sp){
ggplot(data=dat, aes_string(x=sl, y=sw, color=pl)) + geom_point() +facet_wrap(sp)
}
pl.flower3 <- flowerPlotWrap(iris, sl='Sepal.Length', sw='Sepal.Width', pl='Petal.Length', sp= ?????)
Run Code Online (Sandbox Code Playgroud)
除了答案,我会喜欢指向任何人如何解决这个问题?
我有一个数据框,我想了解摘要如何生成它的信息.具体而言,汇总如何生成因子的每个级别中的元素数量的计数.我可以使用摘要,但我想学习如何更好地处理因素.当我尝试?摘要时,我只是得到一般信息.这是不可能的,因为它是字节码?
我收到了一些使用 virtualenv 清理我的 python 模块的建议。我很担心,因为这似乎好得令人难以置信。有没有人发现在使用多核设置、starcluster、numpy、scikit-learn、pandas 或 iPython notebook 时与性能或内存问题相关的缺点。
我将一个名为gob的数据集加载到R中并尝试了方便的summary功能.值得注意的是,第三个四分位数小于平均值.怎么会这样?它是我的数据大小还是其他类似的东西?
我已经尝试为digits参数传递一个大值(例如10),但这并没有解决问题.
> summary(gob, digits=10)
customer_id 100101.D 100199.D 100201.D
Min. : 1083 Min. :0.0000000 Min. :0.0000000 Min. :0.0000000
1st Qu.: 965928 1st Qu.:0.0000000 1st Qu.:0.0000000 1st Qu.:0.0000000
Median :2448738 Median :0.0000000 Median :0.0000000 Median :0.0000000
Mean :2660101 Mean :0.0010027 Mean :0.0013348 Mean :0.0000878
3rd Qu.:4133368 3rd Qu.:0.0000000 3rd Qu.:0.0000000 3rd Qu.:0.0000000
Max. :6538193 Max. :1.0000000 Max. :1.0000000 Max. :0.7520278
Run Code Online (Sandbox Code Playgroud)
请注意,对于gob $ 100201.D,平均值为0.0000878,但是第3曲.= 0.
我最近一直在复习 Codd 的关系代数和关系数据库。我记得关系是一组有序元组,函数是满足域中每个点必须映射到共域中单个点的附加属性的关系。从这个意义上说,每个表都定义了一个从主键到由所有其他列定义的余域空间的有限点函数。这是关系的意义吗?如果是这样,为什么关系代数不是函数代数,为什么不称其为函数数据库呢?
谢谢。顺便说一句,抱歉,如果这不是 stackoverflow 的正常形式(哈,一个数据库笑话!),但我查看了所有论坛,这似乎是最好的。
r ×3
data-science ×1
ggplot2 ×1
math ×1
mean ×1
python-2.7 ×1
quartile ×1
r-faq ×1
virtualenv ×1