小编Top*_*cal的帖子

是否有更好/更有效的方法(矢量化)?适用于熊猫的性能非常慢

所以在R中,我会使用一个优化的应用函数,但我现在已经读过Panda的apply函数是一个抽象的循环,甚至可能比一个慢,它表现在性能上.在我的机器上,处理60k行需要30分钟.

所以基本上我打算根据我需要计算移动平均线的不同组的数据集来计算移动平均线.这些群体很多.所以我基本上首先必须在行/单元格的基础上对数据集进行子集化,然后才计算移动平均值.

所以我试图想出一个矢量化解决方案,但似乎无法想象你如何在矢量化方法中对数据帧进行子集化.

我当前的解决方案使用了一个非常容易理解和维护的apply函数:

df['SMA'] = df.apply(SMA, axis=1)

def SMA(row):
     Subset = df[(df['group']==row['group'])&(df['t']<=row['t'])].reset_index()
     Subset2 = Subset[len(Subset.index)-(2):len(Subset.index)]
     return df['val'].mean()
Run Code Online (Sandbox Code Playgroud)

这是我的预期输出(我目前得到但非常非常缓慢):

这是数据帧,这个例子我想要两个时间点的移动平均值,在这个例子中是"t":

t   group   val moving average
1   A        1  NA
2   A        2  1.5
3   A        3  2.5
1   B        4  NA
2   B        5  4.5
3   B        6  5.5
1   C        7  NA
2   C        8  7.5
3   C        9  8.5
Run Code Online (Sandbox Code Playgroud)

python vectorization pandas

7
推荐指数
1
解决办法
135
查看次数

有条件地加入data.table?

我有以下data.table, dtgrouped2:

     MonthNo Unique Total
 1:       1    AAA    10
 2:       1    BBB     0
 3:       2    CCC     3
 4:       2    DDD     0
 5:       3    AAA     0
 6:       3    BBB    35
 7:       4    CCC    15
 8:       4    AAA     0
 9:       5    BBB    60
10:       5    CCC     0
11:       6    DDD   100
12:       6    AAA     0
Run Code Online (Sandbox Code Playgroud)

另一张桌子,dt2:

     Unique1 StartDate EndDate Amount1 Amount2
1:     AAA        0        1       7       0
3:     AAA        1        2       5       0
2:     AAA        2        4       3       2 …
Run Code Online (Sandbox Code Playgroud)

r dataframe data.table

5
推荐指数
1
解决办法
882
查看次数

App-engine 自定义域未默认为 HTTPS

我刚刚使用我从 GoDaddy 购买的域为我的 Google App Engine 设置了一个自定义域。然后我将域名服务器转移到云 DNS 并将云文档建议的 DNS 记录插入到云 DNS 记录集中,并且它工作正常。

但是,问题是我使用自定义域时,并没有默认为网站的HTTPS版本,我必须手动输入HTTPS(即我不能直接去example.com,我必须去https://example.com).

我在这里做错了什么?

谢谢!

https google-app-engine google-cloud-platform custom-domain

1
推荐指数
1
解决办法
780
查看次数