用中值替换numpy数组中的零

sla*_*tir 15 python arrays replace numpy conditional-statements

我有一个像这样的numpy数组:

foo_array = [38,26,14,55,31,0,15,8,0,0,0,18,40,27,3,19,0,49,29,21,5,38,29,17,16]
Run Code Online (Sandbox Code Playgroud)

我想用整个数组的中值替换所有零(其中零值不包括在中位数的计算中)

到目前为止,我有这样的事情:

foo_array = [38,26,14,55,31,0,15,8,0,0,0,18,40,27,3,19,0,49,29,21,5,38,29,17,16]
foo = np.array(foo_array)
foo = np.sort(foo)
print "foo sorted:",foo
#foo sorted: [ 0  0  0  0  0  3  5  8 14 15 16 17 18 19 21 26 27 29 29 31 38 38 40 49 55]
nonzero_values = foo[0::] > 0
nz_values = foo[nonzero_values]
print "nonzero_values?:",nz_values
#nonzero_values?: [ 3  5  8 14 15 16 17 18 19 21 26 27 29 29 31 38 38 40 49 55]
size = np.size(nz_values)
middle = size / 2
print "median is:",nz_values[middle]
#median is: 26
Run Code Online (Sandbox Code Playgroud)

是否有一种聪明的方法来实现这个numpy语法?

谢谢

bba*_*les 26

该解决方案利用了numpy.median:

import numpy as np
foo_array = [38,26,14,55,31,0,15,8,0,0,0,18,40,27,3,19,0,49,29,21,5,38,29,17,16]
foo = np.array(foo_array)
# Compute the median of the non-zero elements
m = np.median(foo[foo > 0])
# Assign the median to the zero elements 
foo[foo == 0] = m
Run Code Online (Sandbox Code Playgroud)

需要注意的是,你的数组的中位数(没有零)是23.5,但正如所写的那样,这个数据是23.


Ale*_*ary 7

foo2 = foo[:]
foo2[foo2 == 0] = nz_values[middle]
Run Code Online (Sandbox Code Playgroud)

如果您愿意foo2,您可以直接更新foo。Numpy 的智能数组语法可以组合您编写的几行代码。例如,而不是,

nonzero_values = foo[0::] > 0
nz_values = foo[nonzero_values]
Run Code Online (Sandbox Code Playgroud)

你可以这样做

nz_values = foo[foo > 0]
Run Code Online (Sandbox Code Playgroud)

您可以在文档中找到有关“花式索引”的更多信息。