小编Ed *_*ine的帖子

使用ggplot和aes_string创建绘图函数

在Hadley Wickham的第10.3章中的ggplot2一书中,他提到了制作情节功能.我想制作许多使用刻面的类似图,但我不能引用列.如果我的所有引用都是美学的,那么我可以使用aes_string,一切正常.Facet_wrap似乎没有类似的东西.

library(ggplot2)
data(iris)

Run Code Online (Sandbox Code Playgroud)

这是我想要功能化的情节.

pl.flower1 <- ggplot(data=iris, 
                    aes_string(x='Sepal.Length', y='Sepal.Width', color='Petal.Length')) +
                                 geom_point() +facet_wrap(~Species)

Run Code Online (Sandbox Code Playgroud)

如果我不这样做,这是有效的.

flowerPlot <- function(dat, sl, sw, pl, sp){
  ggplot(data=dat, aes_string(x=sl, y=sw, color=pl)) + geom_point()
}
pl.flower2 <- flowerPlot(iris, sl='Sepal.Length', sw='Sepal.Width', pl='Petal.Length')

Run Code Online (Sandbox Code Playgroud)

"sp"应该是下面的两行？一个公式,一个字符串？也许整个方法都是错误的.

flowerPlotWrap <- function(dat, sl, sw, pl, sp){
      ggplot(data=dat, aes_string(x=sl, y=sw, color=pl)) + geom_point() +facet_wrap(sp)
    }
    pl.flower3 <- flowerPlotWrap(iris, sl='Sepal.Length', sw='Sepal.Width', pl='Petal.Length', sp= ?????)

Run Code Online (Sandbox Code Playgroud)

除了答案,我会喜欢指向任何人如何解决这个问题？

r ggplot2

Ed *_*ine

lucky-day

21
推荐指数

2
解决办法

9644
查看次数

如何读取数据框的summary()代码？

我有一个数据框,我想了解摘要如何生成它的信息.具体而言,汇总如何生成因子的每个级别中的元素数量的计数.我可以使用摘要,但我想学习如何更好地处理因素.当我尝试？摘要时,我只是得到一般信息.这是不可能的,因为它是字节码？

r r-faq

Ed *_*ine

2019 07-09

13
推荐指数

1
解决办法

3579
查看次数

使用 virtualenv 进行科学 Python 和机器学习有什么缺点吗？

我收到了一些使用 virtualenv 清理我的 python 模块的建议。我很担心，因为这似乎好得令人难以置信。有没有人发现在使用多核设置、starcluster、numpy、scikit-learn、pandas 或 iPython notebook 时与性能或内存问题相关的缺点。

scientific-computing virtualenv python-2.7

Ed *_*ine

lucky-day

5
推荐指数

1
解决办法

857
查看次数

为什么第三个四分位数小于我数据中的平均值？

我将一个名为gob的数据集加载到R中并尝试了方便的summary功能.值得注意的是,第三个四分位数小于平均值.怎么会这样？它是我的数据大小还是其他类似的东西？

我已经尝试为digits参数传递一个大值(例如10),但这并没有解决问题.

> summary(gob, digits=10)

   customer_id         100101.D            100199.D            100201.D        
 Min.   :   1083   Min.   :0.0000000   Min.   :0.0000000   Min.   :0.0000000  
 1st Qu.: 965928   1st Qu.:0.0000000   1st Qu.:0.0000000   1st Qu.:0.0000000  
 Median :2448738   Median :0.0000000   Median :0.0000000   Median :0.0000000  
 Mean   :2660101   Mean   :0.0010027   Mean   :0.0013348   Mean   :0.0000878  
 3rd Qu.:4133368   3rd Qu.:0.0000000   3rd Qu.:0.0000000   3rd Qu.:0.0000000  
 Max.   :6538193   Max.   :1.0000000   Max.   :1.0000000   Max.   :0.7520278

Run Code Online (Sandbox Code Playgroud)

请注意,对于gob $ 100201.D,平均值为0.0000878,但是第3曲.= 0.

r mean quartile data-science

Ed *_*ine

2019 11-08

1
推荐指数

2
解决办法

5590
查看次数

表格如何像数学关系一样？

我最近一直在复习 Codd 的关系代数和关系数据库。我记得关系是一组有序元组，函数是满足域中每个点必须映射到共域中单个点的附加属性的关系。从这个意义上说，每个表都定义了一个从主键到由所有其他列定义的余域空间的有限点函数。这是关系的意义吗？如果是这样，为什么关系代数不是函数代数，为什么不称其为函数数据库呢？

谢谢。顺便说一句，抱歉，如果这不是 stackoverflow 的正常形式（哈，一个数据库笑话！），但我查看了所有论坛，这似乎是最好的。

math relational-database

Ed *_*ine

lucky-day

0
推荐指数

1
解决办法

514
查看次数