从 netCDF 文件读取数据时 Missing_value 属性丢失?

Mat*_*ira 2 python netcdf missing-data python-xarray

我正在从 NCEP/NCAR Reanalysis 1 的 netCDF 文件中读取风分量(u 和 v)数据来进行一些计算。我正在使用 xarray 来读取文件。

在其中一项计算中,我想屏蔽掉低于某个阈值的所有数据,使它们等于 Missing_value 属性。我不想使用 NaN。

但是,当使用 xarray 读取数据时,missing_value 属性(存在于 netCDF 文件中的变量中)不会复制到包含数据的 xarray.DataArray。

我找不到使用 xarray 从 netCDF 文件变量复制此属性的方法。

这是我正在尝试做的事情的一个例子:

import xarray as xr
import numpy as np

DS1 = xr.open_dataset( "u_250_850_2009012600-2900.nc" )
DS2 = xr.open_dataset( "v_250_850_2009012600-2900.nc" )

u850 = DS1.uwnd.sel( time='2009-01-28 00:00', level=850, lat=slice(10,-60), lon=slice(260,340) )
v850 = DS2.vwnd.sel( time='2009-01-28 00:00', level=850, lat=slice(10,-60), lon=slice(260,340) )

vvel850 = np.sqrt( u850*u850 + v850*v850 )

jet850 = vvel850.where( vvel850 >= 12 )
#jet850 = vvel850.where( vvel850 >= 12, vvel850, vvel850.missing_value )
Run Code Online (Sandbox Code Playgroud)

最后一个注释行是我想要做的:使用missing_value 属性来填充 vvel850 < 12 的位置。最后一个未注释行给了我 NaN,这是我试图避免的。

这是 xarray 从 netCDF 读取数据时的默认行为吗?无论是与否,我如何从文件变量中获取此属性?

附加信息:我正在使用 PyNGL ( http://www.pyngl.ucar.edu/ ) 来制作等高线图,它不适用于 NaN。

谢谢。

马特乌斯

jha*_*man 6

“missing_value”属性保存在encoding字典中。其他属性(例如“units”或“standard_name”)保存在attrs字典中。例如:

v850.encoding['missing_value']
Run Code Online (Sandbox Code Playgroud)

您可能还对其他一些可能对您的用例有所帮助的 xarray 功能感兴趣:

  1. xr.open_dataset有一个mask_and_scale关键字参数。这将关闭将缺失/填充值转换为 nan。
  2. DataArray.to_masked_arrayDataArray将把 a (用 NaN 填充)转换为 anumpy.MaskedArray以用于 Matplotlib 或 PyNGL 等绘图程序。