我有一个包含许多条目的Python列表,我需要使用以下任一项进行缩减采样:
(我需要能够做到两种方式,但一次只能使用一种方式).
我相信,对于最大行数,我可以计算所需的比例并将其传递给比例缩减器:
def downsample_to_max(self, rows, max_rows):
return downsample_to_proportion(rows, max_rows / float(len(rows)))
Run Code Online (Sandbox Code Playgroud)
...所以我真的只需要一个下采样功能.有什么提示吗?
编辑:列表包含对象,而不是数值,所以我不需要插值.丢弃对象很好.
解:
def downsample_to_proportion(self, rows, proportion):
counter = 0.0
last_counter = None
results = []
for row in rows:
counter += proportion
if int(counter) != last_counter:
results.append(row)
last_counter = int(counter)
return results
Run Code Online (Sandbox Code Playgroud)
谢谢.
我已经研究了如果两个字段在同一个表中,如何计算两个字段之间的相关系数:
SELECT corr(column1, column2) FROM table WHERE <my filters>;
Run Code Online (Sandbox Code Playgroud)
...但是当列来自不同的表时,我无法解决该怎么做(我需要对两个表应用相同的过滤器).
有什么提示吗?