在numpy掩码数组上执行乘法时出现溢出警告

Phi*_*hil 5 numpy

我有一个应用程序正在从使用默认netcdf填充值(即9.96920996839e + 36)的netcdf文件中读取32位浮点数据。在应用程序的特定位置,对从输入数据创建的float32类型的掩码数组执行基本缩放(乘法)操作,因此:

x = marr * scale   # or, equivalently, x = ma.multiply(marr,scale)
Run Code Online (Sandbox Code Playgroud)

该操作将引发“乘法时遇到溢出”警告,这可能是因为填充值和小数位的乘积超过了32位浮点数的最大值。已知掩码数组中的其他值很小。然后的问题是,为什么numpy甚至为输入数组中的蒙版元素计算乘积?当然应该忽略这些,对吗?

碰巧的是,警告可以被忽略,因为输出数组中的相应值仍被标记为已屏蔽。但是,知道这是numpy还是“按设计工作”中的错误会很有趣。

下面的代码片段说明了这种行为。

import numpy as np
import numpy.ma as ma
arr = [9.96920996839e+36, 1.123, 2.345, 9.96920996839e+36]
marr = ma.masked_values(np.array(arr, dtype='float32'), 9.96920996839e+36)
x = marr * 128.0
Run Code Online (Sandbox Code Playgroud)

可以预料,如果掩码数组的类型为float64,则不会出现溢出警告(尽管如果比例因子足够大,则可能会出现)。同样,如果在float32情况下使用较小的填充值(例如-1.0e20),则警告消失。

从表面上看,当使用较大的填充值(这与32位fp值的最大值非常接近)时,numpy似乎无法识别掩码值。

TIA,
菲尔

eca*_*mur 2

可能是一个错误。上一行有:

np.seterr(divide='ignore', invalid='ignore')
Run Code Online (Sandbox Code Playgroud)

这表明它旨在处理 0 或 NaN 掩码,但不是非常大的值。它应该是: 

np.seterr(divide='ignore', invalid='ignore', over='ignore')
Run Code Online (Sandbox Code Playgroud)

也可以处理大掩码值。

请注意,numpy.ma操作通常对数组中的所有值进行操作,包括屏蔽值;这大概是因为效率和广播问题。