使用scale_fill_gradient时处理极值/分布的其他方法？

Question

使用scale_fill_gradient时处理极值/分布的其他方法？

例如,我想将颜色z映射到0,将地图映射到"白色".

> a <- data.frame(x=1:10, y=1, z=c(rnorm(8),-12,12))
> a
    x y           z
1   1 1  -0.4603911
2   2 1  -0.4868471
3   3 1   0.2180346
4   4 1  -0.8807652
5   5 1   1.7379462
6   6 1  -0.1334904
7   7 1  -0.3675578
8   8 1   0.9225425
9   9 1 -12.0000000
10 10 1  12.0000000

ggplot(a,aes(x=x,y=y,fill=z)) + geom_bar(stat="identity") + 
  scale_fill_gradient2(high="green", mid="white", low="red")

Run Code Online (Sandbox Code Playgroud)

正如你所看到的那样,颜色并不是真正有用的指标,而不是传达关于值如何分布的一般概念,现在颜色只能告诉哪些值是极端的,留下大多数值无法区分未经训练的眼睛.

有一种方法在geom_raster中的值范围内进行非线性颜色分布,但它看起来有点复杂,我只能模糊地理解它是如何工作的.

在此输入图像描述

然后我想也许order是一个很好的重新缩放方式,因此:

ggplot(a,aes(x=x,y=y,fill=ecdf(z)(z))) + geom_bar(stat="identity") +
scale_fill_gradient2(high="green", mid="white", low="red", midpoint=ecdf(a$z)(0))

Run Code Online (Sandbox Code Playgroud)

它在某种程度上起作用(这里我使用ecdf而不是order找到重新调整的值0.但是,缺点是,我想将图例的标签保持为未缩放的值,而不是重新缩放的值.所以类似于labels=function(x) quantile(a$z, x),我不能让它发挥作用.而且,我发现重复使用ecdf和quantile向前和向后重新缩放都很愚蠢.

在这些情况下是否有更好或更简单的方法,例如,足够强大(不需要是最佳的或非常准确的)足以为各种映射值分布填充合理的颜色.

在此输入图像描述

Answer 1

Bro*_*ieG 3

据我所知，没有一种简单的方法，但您可以使用完全控制映射scale_fill_gradientn。关键是将颜色映射到 0-1 范围内的值，其中 0 是最小值，1 是最大值。这是一个选项：

library(ggplot2)
a <- data.frame(x=1:10, y=1, z=c(rnorm(8),-12,12))
get_col <- colorRamp(c("red", "white", "green"))  # make fun to interpolate colors
quantiles <- (0:6) / 6                            # how many quantiles we want to map 
quantile.vals <- quantile(a$z, quantiles, names=F)# the values for each quantile
colours <- rgb(get_col(quantiles), max=255)       # 7 evenly interpolated colors 
val.remap <- (quantile.vals - min(a$z)) / 
  diff(range(a$z))                                # The values corresponding to the quantiles

ggplot(a, aes(x=x,y=y,fill=z)) + 
  geom_bar(stat="identity") +
  scale_fill_gradientn(
    colours=colours,
    values=val.remap,
    breaks=quantile.vals,# Necessary to get legend values spread appropriately
    guide="legend")      # Necessary to get legend values spread appropriately

Run Code Online (Sandbox Code Playgroud)

在这里，我们选择根据值的分布将均匀插值的颜色分配给值。因此，如果一个值范围对应于分布的很大一部分，即使它实际上跨越了最小-最大范围的相对较小的部分，它也会分配更多的颜色。

如果要将特定颜色指定为零，可以通过编辑与colours、values和breaks参数对应的向量来实现。如果您具有相同数量的高于和低于零的值，则此范围很简单；如果没有，则很烦人。

版本 w/0 设置为白色：

library(ggplot2)
a <- data.frame(x=1:10, y=1, z=c(rnorm(8), -12, 12))
splits <- 7     # should be odd number
mid.point <- 0
pos.vals <- a$z[a$z > mid.point]
neg.vals <- a$z[a$z < mid.point]
pos.quants <- quantile(c(mid.point, pos.vals), 0:((splits - 1) / 2) / ((splits - 1) / 2), names=F)
neg.quants <- quantile(c(mid.point, neg.vals), 0:((splits - 1) / 2) / ((splits - 1) / 2), names=F)
quants <- c(neg.quants, pos.quants[-1])  # drop of the mid-point from pos.quants since otherwise double counted

get_col <- colorRamp(c("red", "white", "green"))  # make fun to interpolate colors
colours <- rgb(get_col(0:(splits - 1)/(splits - 1)), max=255)       # 7 evenly interpolated colors 
val.remap <- (quants - min(quants)) / 
  diff(range(quants))                                # The values corresponding to the quantiles

ggplot(a, aes(x=x,y=y,fill=z)) + 
  geom_bar(stat="identity") +
  scale_fill_gradientn(
    colours=colours,
    values=val.remap,
    breaks=quants,
    guide="legend")

Run Code Online (Sandbox Code Playgroud)

归档时间：	12 年，5 月前
查看次数：	1159 次
最近记录：	6 年，5 月前