TLDR: is-comparison 适用于 Python bool,不适用于 numpy bool_。是否存在其他差异?
几天前,我遇到了布尔人的一种奇怪行为。当我尝试对这个 numpy 数组使用 is-comparison 时:
arr1 = np.array([1,0,2,0], dtype=bool)
arr1
Out[...]: array([ True, False, True, False])
Run Code Online (Sandbox Code Playgroud)
(这些变量名是虚构的,与真实变量名或生产代码的任何相似之处纯属巧合)
我看到了这个结果:
arr1 is True
Out[...]: False
Run Code Online (Sandbox Code Playgroud)
这是合乎逻辑的,因为arr1它不是 True 或 False,它是 numpy 数组。我检查了这个:
arr1 == True
Out[...]: array([ True, False, True, False])
Run Code Online (Sandbox Code Playgroud)
这按预期工作。我提到了这个可爱的行为并立即忘记了它。第二天,我检查了数组元素的真实性:
[elem is False for elem in arr1]
它返回给我这个!
Out[...]: [False, False, False, False]
我真的很困惑,因为我记得在 Python 数组中(我认为问题出在数组行为中):
arr2 = [True, False, True, False]
[elem is False for elem in arr2]
Run Code Online (Sandbox Code Playgroud)
有用:
Out[...]: [False, True, False, True]
此外,它在我的另一个 numpy 数组中工作:
very_cunning_arr = np.array([1, False, 2, False, []])
[elem is False for elem in very_cunning_arr]
Run Code Online (Sandbox Code Playgroud)
Out[...]: [False, True, False, True, False]
当我深入研究我的数组时,我解开了它very_cunning_arr是由numpy.object几个非数字元素arr1构造的,因此它包含 Python bool并由numpy.bool_. 所以我检查了他们的行为:
numpy_waka = np.bool_(True)
numpy_waka
Run Code Online (Sandbox Code Playgroud)
Out[...]: True
python_waka = True
python_waka
Run Code Online (Sandbox Code Playgroud)
Out[...]: True
[numpy_waka is True, python_waka is True]
我终于找到了区别:
Out[...]: [False, True]
在所有这些之后,我有两个问题:
numpy.bool_和bool在他们共同的行为有些另一个区别是什么?(我知道numpy.bool_有很多 numpy 函数和参数,比如.T和其他)(PS:是的,现在我知道与 True/False 相比is是不好的):
不要使用 == 将布尔值与 True 或 False 进行比较。
Run Code Online (Sandbox Code Playgroud)Yes: if greeting: No: if greeting == True: Worse: if greeting is True:
Run Code Online (Sandbox Code Playgroud)
编辑 1:正如在另一个问题中提到的,numpy 有它自己的bool_类型。但是这个问题的细节有点不同:我发现 is-statements 的工作方式不同,但在这种差异之前 - 是否还有其他共同点bool_和bool行为不同?如果是,具体是什么?
In [119]: np.array([1,0,2,0],dtype=bool)
Out[119]: array([ True, False, True, False])
In [120]: np.array([1, False, 2, False, []])
Out[120]: array([1, False, 2, False, list([])], dtype=object)
Run Code Online (Sandbox Code Playgroud)
注意数据类型。使用 object dtype,数组的元素是 Python 对象,就像它们在源列表中一样。
在第一种情况下,数组 dtype 是布尔值。这些元素代表布尔值,但它们本身并不是 PythonTrue/False对象。严格来说Out[119]不contain np.bool_反对。 Out[119][1]是 type bool_,但这是“拆箱”的结果。ndarray当您请求一个元素时,这就是索引产生的结果。(这种“拆箱”区别适用于所有非对象 dtype。)
通常我们不创建dtype对象,更喜欢np.array(True),而是按照您的示例:
In [124]: np.bool_(True)
Out[124]: True
In [125]: type(np.bool_(True))
Out[125]: numpy.bool_
In [126]: np.bool_(True) is True
Out[126]: False
In [127]: type(True)
Out[127]: bool
Run Code Online (Sandbox Code Playgroud)
is是一个严格的测试,不仅仅是为了平等,而是为了身份。不同类别的对象不满足is测试。对象可以满足==测试而不满足is测试。
让我们使用对象 dtype 数组:
In [129]: np.array([1, False, 2, np.bool_(False), []])
Out[129]: array([1, False, 2, False, list([])], dtype=object)
In [130]: [i is False for i in _]
Out[130]: [False, True, False, False, False]
Run Code Online (Sandbox Code Playgroud)
在Out[129]显示中,两个False对象显示相同,但Out[130]测试显示它们不同。
专注于您的问题。
np.bool_(False)是一个独特的对象,但不同于False。正如您所注意到的,它具有许多与np.array(False).
如果数组 dtype 是bool它不包含 Pythonbool对象。它甚至不包含np.bool_对象。然而,索引这样的数组会产生一个bool_. 并item()反过来应用它会产生一个 Python bool。
如果数组对象 dtype,它很可能将包含 Python bool,除非您已采取特殊步骤来包含bool_对象。