前几天被问到这个问题,但没有人可以想象我的问题,所以我做了一个例子.
A <- c('a','b', 'c','d','e')
types <- factor(A)
B <- c(1,2,3,4,5)
C <- c(6,7,8,9,10)
D <- c(1,2,1,2,3)
ABC <- data.frame(B,C,D,types)
library(ggplot2)
ggplot(ABC, aes(x=B ,y=C ,size=D, colour=as.factor(types),label=types, shape=as.factor(types))) +
geom_point()+geom_text(size=2, hjust=0,colour="black", vjust=0) +
scale_size_area(max_size=20, "D", breaks=c(100,500,1000,3000,5000)) +
scale_x_log10(lim=c(0.05,10),breaks=c(0.1,1,10))+ scale_y_continuous(lim=c(0,30000000)) +
scale_shape_manual(values=c(15,18,16,17,19))`
Run Code Online (Sandbox Code Playgroud)
绘制这个图表,你会有因素有颜色和形状归因于它们.
在我的代码中,我使用scale_shape_manual来设置形状,它们按顺序定义,即因子的顺序是a,b,c,d,e,我的值是15,18,16,17,19,所以a = 15(a方形),b = 18等
我想按因子设置这些形状.我的数据每天都在变化,因素将以不同的顺序排列,但我总是希望相同的因素具有相同的形状.
显然这段代码不起作用,但是类似于:
scale_shape_manual(values=('a'=15, 'b'=18, 'c'=16, 'd'=17, 'e'=19))
如果我也可以做同样的颜色会有所帮助.
谢谢
我在Linux上运行并且mclapply很容易使用.parlapply即使在使用之后,我也遇到了一些错误clusterEvalQ.
在我进一步解决这个问题之前,有什么意义,即两者之间是否存在显着的速度差异,或者人们parLapply在Windows上使用时是否会使用?
我已经阅读parLapplyLB并且可以看到这种方法的用途,但如果我严格关注mclapply并且parlapplyFORK方法和PSOCK方法的速度变化很大吗?
我的功能的性质可能决定答案; 它正在使用stri_extract.
我有一个清单:
files <- list.files(path="new/", pattern="*.csv", full.names=TRUE, recursive=FALSE)
Run Code Online (Sandbox Code Playgroud)
然后我可以从以下位置找到尺寸:
x <- file.info(files)
x[order(-x$size),]
我不知道如何根据 中files找到的信息订购file.info(files),在这种情况下为 size。