Numpy在哪里功能多种条件

use*_*183 114 python numpy

我有一系列称为dists的距离.我想选择两个值之间的dists.我写了以下代码行来做到这一点:

 dists[(np.where(dists >= r)) and (np.where(dists <= r + dr))]
Run Code Online (Sandbox Code Playgroud)

但是,这仅选择条件

 (np.where(dists <= r + dr))
Run Code Online (Sandbox Code Playgroud)

如果我通过使用临时变量顺序执行命令,它可以正常工作.为什么上面的代码不起作用,我如何让它工作?

干杯

ask*_*han 176

您的特定情况下,最好的方法将您的两个标准更改为一个标准:

dists[abs(dists - r - dr/2.) <= dr/2.]
Run Code Online (Sandbox Code Playgroud)

它只创建一个布尔数组,在我看来更容易阅读,因为它说,dist在一个drr(虽然我将重新定义r为您感兴趣的区域的中心而不是开头,所以r = r + dr/2.)但这并不能回答您的问题.


你的问题的答案:如果你只是想过滤掉那些不符合你标准的元素,你
实际上并不需要:wheredists

dists[(dists >= r) & (dists <= r+dr)]
Run Code Online (Sandbox Code Playgroud)

因为&会给你一个元素and(括号是必要的).

或者,如果您where因某些原因想要使用,您可以:

 dists[(np.where((dists >= r) & (dists <= r + dr)))]
Run Code Online (Sandbox Code Playgroud)

原因:
它不起作用的原因是因为np.where返回索引列表,而不是布尔数组.您试图and在两个数字列表之间进行操作,这当然没有您期望的True/ False值.如果ab都是True值,则a and b返回b.所以说出一些[0,1,2] and [2,3,4]会给你的东西[2,3,4].这是在行动:

In [230]: dists = np.arange(0,10,.5)
In [231]: r = 5
In [232]: dr = 1

In [233]: np.where(dists >= r)
Out[233]: (array([10, 11, 12, 13, 14, 15, 16, 17, 18, 19]),)

In [234]: np.where(dists <= r+dr)
Out[234]: (array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12]),)

In [235]: np.where(dists >= r) and np.where(dists <= r+dr)
Out[235]: (array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12]),)
Run Code Online (Sandbox Code Playgroud)

例如,你期望比较的只是布尔数组

In [236]: dists >= r
Out[236]: 
array([False, False, False, False, False, False, False, False, False,
       False,  True,  True,  True,  True,  True,  True,  True,  True,
        True,  True], dtype=bool)

In [237]: dists <= r + dr
Out[237]: 
array([ True,  True,  True,  True,  True,  True,  True,  True,  True,
        True,  True,  True,  True, False, False, False, False, False,
       False, False], dtype=bool)

In [238]: (dists >= r) & (dists <= r + dr)
Out[238]: 
array([False, False, False, False, False, False, False, False, False,
       False,  True,  True,  True, False, False, False, False, False,
       False, False], dtype=bool)
Run Code Online (Sandbox Code Playgroud)

现在你可以调用np.where组合的布尔数组:

In [239]: np.where((dists >= r) & (dists <= r + dr))
Out[239]: (array([10, 11, 12]),)

In [240]: dists[np.where((dists >= r) & (dists <= r + dr))]
Out[240]: array([ 5. ,  5.5,  6. ])
Run Code Online (Sandbox Code Playgroud)

或者使用花式索引简单地使用布尔数组索引原始数组

In [241]: dists[(dists >= r) & (dists <= r + dr)]
Out[241]: array([ 5. ,  5.5,  6. ])
Run Code Online (Sandbox Code Playgroud)


Kas*_*mvd 50

由于接受的答案很好地解释了问题.你也可以使用numpy逻辑函数,这里更适合多种条件:

np.where(np.logical_and(np.greater_equal(dists,r),np.greater_equal(dists,r + dr)))
Run Code Online (Sandbox Code Playgroud)

  • 为什么 `logic_and` 比 `cond1 &amp; cond2` 更*Numpythonic*? (13认同)
  • 在末尾缺少一个`)`,对吗? (2认同)

Ami*_*ola 22

这里要指出一件有趣的事情;在这种情况下,使用ORAND的常用方法也可以使用,但需要稍作改动。而不是“和”和“或”,而是使用与号(&)管道运算符(|),它会起作用。

当我们使用'and' 时

ar = np.array([3,4,5,14,2,4,3,7])
np.where((ar>3) and (ar<6), 'yo', ar)

Output:
ValueError: The truth value of an array with more than one element is ambiguous. Use a.any() or a.all()
Run Code Online (Sandbox Code Playgroud)

当我们使用& 符号(&) 时

ar = np.array([3,4,5,14,2,4,3,7])
np.where((ar>3) & (ar<6), 'yo', ar)

Output:
array(['3', 'yo', 'yo', '14', '2', 'yo', '3', '7'], dtype='<U11')
Run Code Online (Sandbox Code Playgroud)

这与我们尝试在 Pandas Dataframe 的情况下应用多个过滤器的情况相同。现在,这背后的原因必须与逻辑运算符和位运算符有关,为了更多地了解相同的内容,我建议在 stackoverflow 中查看此答案或类似的问答。

更新

有用户问,为什么需要在括号内给出 (ar>3) 和 (ar<6)。嗯,事情就是这样。在我开始谈论这里发生的事情之前,需要了解 Python 中的运算符优先级。

与 BODMAS 类似,python 也优先考虑应该首先执行的操作。首先执行括号内的项目,然后按位运算符开始工作。我将在下面展示当你使用和不使用 "(", ")" 时在这两种情况下会发生什么。

情况1:

np.where( ar>3 & ar<6, 'yo', ar)
np.where( np.array([3,4,5,14,2,4,3,7])>3 & np.array([3,4,5,14,2,4,3,7])<6, 'yo', ar)
Run Code Online (Sandbox Code Playgroud)

由于这里没有括号,因此按位运算符(&)在这里变得很困惑,您甚至要求它进行逻辑 AND 运算,因为在运算符优先级表中,如果您看到的话,&它的优先级高于<or>运算符。这是从最低优先级到最高优先级的表格。

在此处输入图片说明

它甚至不执行<>操作并被要求执行逻辑与操作。所以这就是它给出错误的原因。

可以查看以下链接以了解更多信息:运算符优先级

现在到案例 2:

如果您确实使用了支架,您会清楚地看到会发生什么。

np.where( (ar>3) & (ar<6), 'yo', ar)
np.where( (array([False,  True,  True,  True, False,  True, False,  True])) & (array([ True,  True,  True, False,  True,  True,  True, False])), 'yo', ar)
Run Code Online (Sandbox Code Playgroud)

两个 True 和 False 数组。您可以轻松地对它们执行逻辑与运算。这给了你:

np.where( array([False,  True,  True, False, False,  True, False, False]),  'yo', ar)
Run Code Online (Sandbox Code Playgroud)

剩下的你知道,np.where,对于给定的情况,无论在哪里为 True,都分配第一个值(即这里的 'yo'),如果为 False,则分配另一个值(即这里,保留原始值)。

就这样。我希望我很好地解释了查询。


eri*_*ric 10

np.where()处理多种条件,只需执行以下操作:

np.where((condition 1) & (condition 2)) # for and
np.where((condition 1) | (condition 2)) # for or
Run Code Online (Sandbox Code Playgroud)

我知道这重复了一些其他答案,但我把这个简单的答案放在这里,是为了让人们仍然想知道,“为什么我会收到关于The truth value of an array with more than one element is ambiguous”的恼人的错误消息,他们被非常冗长和复杂的答案所困惑,这些答案正在解决某些专业性的问题原始帖子。

现在,至于为什么当你使用and而不是numpy 时会中断&,我不会在这里尝试回答。它就是这样:) 请参阅此处的其他答案以获取解释。恕我直言,这似乎是他们应该修复的问题,而不是为了一致性而强制它。或者至少他们应该提供更好的错误消息。:)


小智 5

我喜欢np.vectorize用于此类任务。考虑以下:

>>> # function which returns True when constraints are satisfied.
>>> func = lambda d: d >= r and d<= (r+dr) 
>>>
>>> # Apply constraints element-wise to the dists array.
>>> result = np.vectorize(func)(dists) 
>>>
>>> result = np.where(result) # Get output.
Run Code Online (Sandbox Code Playgroud)

您也可以使用np.argwhere代替以np.where获得清晰的输出。但这是您的电话:)

希望能帮助到你。

  • 这非常慢。正如文档中已经指出的:“提供向量化函数主要是为了方便,而不是为了性能。其实现本质上是一个 for 循环。” (2认同)

小智 5

这应该有效:

dists[((dists >= r) & (dists <= r+dr))]
Run Code Online (Sandbox Code Playgroud)