小编use*_*937的帖子

如何反向转换正态分数转换后的数据

我每天有61个测量站的降雨量,为期12年(8000平方公里).

目标是创造5公里和25公里分辨率网格日降雨量产品.由于车站的数量很少,并且即使在雨季也不是所有车站都有雨,我选择使用气候变异图.

典型日(irain)的雨量计测量如下,具有由NA表示的少量缺失值.

7.8  4.4 15.4 19.1  5.8    0   42  6.4   21    21     0     0     0  15.6 0     0    10     5   1.2     0  14.4    NA    25  13.2     0   9.2 2   6.6   7.8  13.2  15.4    NA     9     0  15.5     0  18.6     6 0   4.8  10.6     0    9     0  12.4    NA    12     0     3    14 10    10     0    68  21.8    18  14.8   5.4     7     0    NA

Run Code Online (Sandbox Code Playgroud)

作为日常雨量偏斜,变换i相测试立方根变换和日志变换(log1p)为每天单独.然而,对于所有这些日子来说,两种变换都不适合我用shapiro wilk测试测试.因此,我选择正常分数分数变换(NCR),如Grimes&Pardo(2009)降雨量地统计分析所示.并使用了Ashton Shortridge教授的代码

以下代码用于生成季风季节的气候变异函数.请注意,我曾使用超过30%的电台报告下雨的日子.没有找到任何参考.当我达到65%的天数超过阈值时,选择30%.

lag = 3 …

Run Code Online (Sandbox Code Playgroud)

interpolation r gstat kriging

use*_*937

2017 05-13

6
推荐指数

1
解决办法

623
查看次数

如何在不跳过 Pandas 中的 nan 值的情况下重新采样

我正在尝试获取具有 NaN 值的数据的 10 天聚合。如果在 10 天的持续时间内有 NaN 值，则 10 天的总和应该返回一个 nan 值。

当我应用以下代码时，pandas 将 NaN 视为零并返回剩余天数的总和。

dateRange = pd.date_range(start_date, periods=len(data), freq='D')
# Creating a data frame so that the timeseries can handle numpy array.
df = pd.DataFrame(data)
base_Series = pd.DataFrame(list(df.values), index=dateRange)
# Converting to aggregated series
agg_series = base_Series.resample('10D', how='sum')
agg_data = agg_series.values

Run Code Online (Sandbox Code Playgroud)

样本数据：

2011-06-01  46.520536
2011-06-02   8.988311
2011-06-03   0.133823
2011-06-04   0.274521
2011-06-05   1.283360
2011-06-06   2.556313
2011-06-07   0.027461
2011-06-08   0.001584
2011-06-09   0.079193
2011-06-10   2.389549
2011-06-11        NaN
2011-06-12   0.195844
2011-06-13 …

Run Code Online (Sandbox Code Playgroud)

python pandas

use*_*937

lucky-day

2
推荐指数

1
解决办法

4500
查看次数