所以在R中,我会使用一个优化的应用函数,但我现在已经读过Panda的apply函数是一个抽象的循环,甚至可能比一个慢,它表现在性能上.在我的机器上,处理60k行需要30分钟.
所以基本上我打算根据我需要计算移动平均线的不同组的数据集来计算移动平均线.这些群体很多.所以我基本上首先必须在行/单元格的基础上对数据集进行子集化,然后才计算移动平均值.
所以我试图想出一个矢量化解决方案,但似乎无法想象你如何在矢量化方法中对数据帧进行子集化.
我当前的解决方案使用了一个非常容易理解和维护的apply函数:
df['SMA'] = df.apply(SMA, axis=1)
def SMA(row):
Subset = df[(df['group']==row['group'])&(df['t']<=row['t'])].reset_index()
Subset2 = Subset[len(Subset.index)-(2):len(Subset.index)]
return df['val'].mean()
Run Code Online (Sandbox Code Playgroud)
这是我的预期输出(我目前得到但非常非常缓慢):
这是数据帧,这个例子我想要两个时间点的移动平均值,在这个例子中是"t":
t group val moving average
1 A 1 NA
2 A 2 1.5
3 A 3 2.5
1 B 4 NA
2 B 5 4.5
3 B 6 5.5
1 C 7 NA
2 C 8 7.5
3 C 9 8.5
Run Code Online (Sandbox Code Playgroud) 我有以下data.table, dtgrouped2:
MonthNo Unique Total
1: 1 AAA 10
2: 1 BBB 0
3: 2 CCC 3
4: 2 DDD 0
5: 3 AAA 0
6: 3 BBB 35
7: 4 CCC 15
8: 4 AAA 0
9: 5 BBB 60
10: 5 CCC 0
11: 6 DDD 100
12: 6 AAA 0
Run Code Online (Sandbox Code Playgroud)
另一张桌子,dt2:
Unique1 StartDate EndDate Amount1 Amount2
1: AAA 0 1 7 0
3: AAA 1 2 5 0
2: AAA 2 4 3 2 …Run Code Online (Sandbox Code Playgroud) 我刚刚使用我从 GoDaddy 购买的域为我的 Google App Engine 设置了一个自定义域。然后我将域名服务器转移到云 DNS 并将云文档建议的 DNS 记录插入到云 DNS 记录集中,并且它工作正常。
但是,问题是我使用自定义域时,并没有默认为网站的HTTPS版本,我必须手动输入HTTPS(即我不能直接去example.com,我必须去https://example.com).
我在这里做错了什么?
谢谢!