dtype = object在创建numpy数组时意味着什么?

Avi*_*dey 20 python arrays types numpy

我正在尝试使用numpy数组并创建了一个numpy字符串数组:

ar1 = np.array(['avinash', 'jay'])
Run Code Online (Sandbox Code Playgroud)

正如我从其官方指南中读到的那样,numpy数组上的操作会传播到单个元素.所以我这样做了:

ar1 * 2
Run Code Online (Sandbox Code Playgroud)

但后来我得到了这个错误:

TypeError                                 Traceback (most recent call last)
<ipython-input-22-aaac6331c572> in <module>()
----> 1 ar1 * 2

TypeError: unsupported operand type(s) for *: 'numpy.ndarray' and 'int'
Run Code Online (Sandbox Code Playgroud)

但是当我用的时候 dtype=object

ar1 = np.array(['avinash', 'jay'], dtype=object)
Run Code Online (Sandbox Code Playgroud)

在创建数组时,我能够完成所有操作.

谁能告诉我为什么会这样?

Ale*_*ley 25

NumPy数组存储为连续的内存块.它们通常具有单个数据类型(例如整数,浮点数或固定长度字符串),然后内存中的位被解释为具有该数据类型的值.

创建一个dtype=object不同的数组.现在,数组占用的内存中填充了Python对象的指针,这些对象存储在内存中的其他地方(就像Python list实际上只是指向对象的指针列表,而不是对象本身).

算术运算符,如*不使用数组,如工作ar1其中有一个string_数据类型( -见下面有特殊的功能,而不是).NumPy只是将内存中的位视为字符,*操作符在这里没有意义.但是,行

np.array(['avinash','jay'], dtype=object) * 2
Run Code Online (Sandbox Code Playgroud)

因为现在数组是一个(指向)Python字符串的数组.该*运营商很好地为这些Python字符串对象定义的.在内存中创建新的Python字符串,并返回一个object引用新字符串的新数组.


如果您有一个带string_unicode_dtype 的数组并想重复每个字符串,您可以使用np.char.multiply:

In [52]: np.char.multiply(ar1, 2)
Out[52]: array(['avinashavinash', 'jayjay'], 
      dtype='<U14')
Run Code Online (Sandbox Code Playgroud)

NumPy还有许多其他矢量化字符串方法.

  • 您是否知道在对对象数组进行操作与尝试遍历python列表时是否可以获得任何效率提升? (3认同)