在斑点密集的区域上,alpha 仍然不透明的散点图

ZSG*_*ZSG 5 python alpha matplotlib scatter-plot

我有一个散点图,它从两个不同的数据集中绘制大量的点。在某些区域,存在大量的点,因此即使具有非常低的 alpha(例如 alpha=0.1),您也无法看穿质量。但在该 alpha 值下,您几乎看不到稀疏区域中的点。有没有一种方法可以限制堆叠点的 alpha 值,或者以某种方式使背景在密集区域下可见,同时不洗掉稀疏区域?

代码片段如下所示:

# Code to populate the datasets not included.
fig, ax = plt.subplots()
ax.scatter(x1, y1, s=12, color='red')
ax.scatter(x2, y2, s=12, color='blue', alpha=0.1)
# Plus code to do xlabels and such not included.
Run Code Online (Sandbox Code Playgroud)

产生这个:

在此输入图像描述

正如您所看到的,很难看到底部红色腿的边界,但仍然使顶部蓝色腿打出。

有什么办法可以创造出这样的效果吗?

提前致谢。

编辑

一个好的建议似乎是使用 hexbin 而不是 scatter。这看起来确实很有希望,但颜色仍然不能很好地混合。例如,

ax.hexbin(x1, y1, cmap='Reds', mincnt=1, vmax=100)
ax.hexbin(x2, y2, cmap='Blues', mincnt=1, vmax=50, alpha=0.8, linewidths=0)
Run Code Online (Sandbox Code Playgroud)

产量:

在此输入图像描述

如果能让蓝色和红色融合在一起,那就太好了。也许每个像素可以有一个来自一个数据集的 R 值,以及来自另一个数据集的 B 值或其他值?但在 hexbin 中似乎不是一个选项。

编辑

应用托马西洛的答案后:

在此输入图像描述

谢谢,我觉得比原版好看。

小智 1

1)为了改进hexbin图,可以使用选项bins='log'。这会以对数方式计算六边形分箱的颜色,有效地使较低的数字比较高的数字更突出。

2)自己计算每个数据集的密度。并且通过例如让一种密度影响红色通道而另一种密度影响蓝色通道,从两种密度生成颜色。使用 imshow 绘制结果。

就像是

import matplotlib.pyplot as plt
import numpy as np
import itertools

x1 = np.random.binomial(5100,0.5,51100)
y1 = np.random.binomial(5000,0.7,51100)
x2 = np.random.binomial(5000,0.5,51100)
y2 = np.random.binomial(5000,0.7,51100)


xmin,xmax,xnum = 2350,2700,50
ymin,ymax,ynum = 3350,3700,50
xx,yy=np.mgrid[xmin:xmax:xnum*1j,ymin:ymax:ynum*1j]

def closest_idx(x,y):
    idcs    = np.argmin((xx-x)**2 + (yy-y)**2)
    i_x,i_y = np.unravel_index(idcs, (xnum,ynum) )
    return i_x,i_y

def calc_count( xdat,ydat ):
    ct = np.zeros_like(xx)
    for x,y in itertools.izip(xdat,ydat):
        ix,iy = closest_idx(x,y)
        ct [ix,iy] += 1
    return ct

ct1 = calc_count( x1,y1 )
ct2 = calc_count( x2,y2 )

def color_mix( c1 , c2 ):
    cm=np.empty_like(c1)
    for i in [0,1,2]:
        cm[i] = (c1[i]+c2[i])/2.
    return cm

dens1 = ct1 / np.max(ct1)
dens2 = ct2 / np.max(ct2)

ct1_color = np.array([1+0*dens1 , 1-dens1 , 1-dens1  ])
ct2_color = np.array([1-dens2   , 1-dens2 , 1+0*dens2])

col = color_mix( ct1_color , ct2_color )
col = np.transpose( col, axes=(2,1,0))


plt.imshow( col , interpolation='nearest' ,extent=(xmin,xmax,ymin,ymax),origin='lower')
plt.show()
Run Code Online (Sandbox Code Playgroud)