bar*_*ich 2 python python-xarray netcdf4
当我尝试使用 xarray 导入 netCDF4 文件时,出现以下错误:
MissingDimensionsError:“名称”超过一维且与其维度之一同名(“时间”、“名称”)。xarray 不允许使用此类变量,因为它们与用于标记尺寸的坐标冲突。
但是,我可以使用 netCDF4 python 库成功导入这些数据,并从中获取我需要的数据。问题是这个方法非常慢,所以我正在寻找更快的方法并想尝试 xarray。这是一个示例文件,以及给我带来问题的代码。
from netCDF4 import Dataset
#import matplotlib
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np
#import seaborn as sns
from tkinter import Tk
from tkinter.filedialog import askdirectory
import os
import xarray as xr
#use this function to get a directory name where the files are
def get_dat():
root = Tk()
root.withdraw()
root.focus_force()
root.attributes("-topmost", True) #makes the dialog appear on top
filename = askdirectory() # Open single file
root.destroy()
root.quit()
return filename
directory=get_dat()
#loop through files in directory and read the netCDF4 files
for filename in os.listdir(directory): #loop through files in user's dir
if filename.endswith(".nc"): #all my files are .nc not .nc4
runstart=pd.datetime.now()
#I get the error right here
rootgrp3 = xr.open_dataset(directory+'/'+filename)
#more stuff happens here with the data, but this stuff works
Run Code Online (Sandbox Code Playgroud)
小智 6
该问题目前仍然有效。当坐标具有多个维度并且与其中一个维度同名时,就会出现问题。
例如,GOTM 模型result.nc发出的输出文件在坐标和 方面存在以下问题:zzi
dimensions:
time = UNLIMITED ; // (4018 currently)
lon = 1 ;
lat = 1 ;
z = 218 ;
zi = 219 ;
variables:
...
float z(time, z, lat, lon) ;
float zi(time, zi, lat, lon) ;
Run Code Online (Sandbox Code Playgroud)
这里建议对 xr.open_dataset() 实现“rename_var”kwarg 作为解决方法,但据我所知,它尚未实现。
我使用的快速解决方法是在需要时从 python 调用 nco-ncrename 。
就我而言:
os.system('ncrename -v z,z_coord -v zi,zi_coord result.nc resultxr.nc')
Run Code Online (Sandbox Code Playgroud)
这允许
r2 = xr.open_dataset(testdir+'resultxr.nc')
Run Code Online (Sandbox Code Playgroud)
尽管
r = xr.open_dataset(testdir+'result.nc')
Run Code Online (Sandbox Code Playgroud)
失败了。
| 归档时间: |
|
| 查看次数: |
1460 次 |
| 最近记录: |