什么是Python缓冲区类型?

sat*_*oru 130 python python-2.7

bufferpython中有一个类型,但我不知道如何使用它.

Python文档中,描述是:

buffer(object[, offset[, size]])

object参数必须是支持缓冲区调用接口的对象(如字符串,数组和缓冲区).将创建一个引用object参数的新缓冲区对象.缓冲区对象将是从对象的开头(或从指定的偏移量)开始的切片.切片将延伸到对象的末尾(或者具有由size参数给出的长度).

Sco*_*ths 134

示例用法:

>>> s = 'Hello world'
>>> t = buffer(s, 6, 5)
>>> t
<read-only buffer for 0x10064a4b0, size 5, offset 6 at 0x100634ab0>
>>> print t
world
Run Code Online (Sandbox Code Playgroud)

在这种情况下,缓冲区是一个子字符串,从位置6开始,长度为5,并且不占用额外的存储空间 - 它引用字符串的一个片段.

这对于像这样的短字符串不是很有用,但在使用大量数据时可能是必要的.这个例子使用了一个mutable bytearray:

>>> s = bytearray(1000000)   # a million zeroed bytes
>>> t = buffer(s, 1)         # slice cuts off the first byte
>>> s[1] = 5                 # set the second element in s
>>> t[0]                     # which is now also the first element in t!
'\x05'
Run Code Online (Sandbox Code Playgroud)

如果您希望在数据上有多个视图并且不希望(或不能)在内存中保存多个副本,这将非常有用.

请注意,buffer已经被memoryviewPython 3中更好的命名所取代,尽管您可以在Python 2.7中使用.

另请注意,您无法在不深入C API的情况下为自己的对象实现缓冲区接口,即您无法在纯Python中执行此操作.

  • 对于像我这样的Python noobs:buffer是Python 3中的memoryview (11认同)
  • 一般来说,切片会占用额外的存储空间,所以是的[6:11]`将是一个副本.如果设置`t = s [6:11]`然后设置`del s`,它会释放`s`占用的内存,证明`t`被复制了.(要看到这个,你需要一个更大的`s`并跟踪Python的内存使用情况).然而,如果涉及的数据不多,那么制作副本会更有效率. (8认同)
  • @ Saturo.Logic:我认为你应该接受的是答案;-) (4认同)

And*_*ner 22

我认为缓冲区在将python连接到本机库时非常有用.(Guido van Rossum buffer此邮件列表中解释).

例如,numpy似乎使用缓冲区来进行有效的数据存储:

import numpy
a = numpy.ndarray(1000000)
Run Code Online (Sandbox Code Playgroud)

a.data是一个:

<read-write buffer for 0x1d7b410, size 8000000, offset 0 at 0x1e353b0>
Run Code Online (Sandbox Code Playgroud)