- mongodb - 在 MongoDB mapreduce 中,如何展平值对象?
- javascript - 对象传播与 Object.assign
- html - 输入类型 ="submit"Vs 按钮标签它们可以互换吗?
- sql - 使用 MongoDB 而不是 MS SQL Server 的优缺点
查看documentation在内存 View 上:
memoryview objects allow Python code to access the internal data of an object that supports the buffer protocol without copying.
class memoryview(obj)
Create a memoryview that references obj. obj must support the buffer protocol. Built-in objects that support the buffer protocol include bytes and bytearray.
然后我们给出示例代码:
>>> v = memoryview(b'abcefg')
>>> v[1]
98
>>> v[-1]
103
>>> v[1:4]
<memory at 0x7f3ddc9f4350>
>>> bytes(v[1:4])
b'bce'
报价结束,现在让我们仔细看看:
>>> b = b'long bytes stream'
>>> b.startswith(b'long')
True
>>> v = memoryview(b)
>>> vsub = v[5:]
>>> vsub.startswith(b'bytes')
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
AttributeError: 'memoryview' object has no attribute 'startswith'
>>> bytes(vsub).startswith(b'bytes')
True
>>>
所以我从上面收集到的信息:
我们创建一个 memoryview 对象来暴露一个缓冲区对象的内部数据,而无需然而,复制是为了对对象做任何有用的事情(通过调用方法由对象提供),我们必须创建一个副本!
当我们有一个大对象时,通常需要 memoryview(或旧的缓冲区对象),切片也可以很大。需要更高的效率如果我们正在制作大片,或者制作小片但次数很多。
对于上述方案,我看不出它对任何一种情况都有什么用处,除非有人可以向我解释我在这里缺少什么。
编辑1:
我们有大量数据,我们希望通过从头到尾进行处理来处理它结束,例如从字符串缓冲区的开头提取标记,直到缓冲区被消耗。在 C 术语中,这是通过缓冲区推进指针,并且可以传递指针到任何期望缓冲区类型的函数。类似的事情在python中怎么做?
人们建议解决方法,例如许多字符串和正则表达式函数占据位置可用于模拟推进指针的参数。这有两个问题:第一这是一种解决方法,你被迫改变你的编码风格来克服缺点,并且第二:并非所有函数都有位置参数,例如正则表达式函数和 startswith
有,encode()
/decode()
没有。
其他人可能会建议以 block 的形式加载数据,或者以较小的方式处理缓冲区大于最大 token 的段。好的,所以我们知道这些可能的解决方法,但我们应该在 python 中以更自然的方式工作试图改变编码风格以适应语言 - 不是吗?
编辑2:
代码示例会让事情变得更清楚。这就是我想要做的事情,而且我认为 memoryview 乍一看会让我做的事情。让我们为我正在寻找的功能使用 pmview(正确的内存 View ):
tokens = []
xlarge_str = get_string()
xlarge_str_view = pmview(xlarge_str)
while True:
token = get_token(xlarge_str_view)
if token:
xlarge_str_view = xlarge_str_view.vslice(len(token))
# vslice: view slice: default stop paramter at end of buffer
tokens.append(token)
else:
break
最佳答案
memoryview
有用的一个原因是它们可以在不复制底层数据的情况下进行切片,这与 bytes
/str
不同。
以下面的玩具为例。
import time
for n in (100000, 200000, 300000, 400000):
data = b'x'*n
start = time.time()
b = data
while b:
b = b[1:]
print(f' bytes {n} {time.time() - start:0.3f}')
for n in (100000, 200000, 300000, 400000):
data = b'x'*n
start = time.time()
b = memoryview(data)
while b:
b = b[1:]
print(f'memoryview {n} {time.time() - start:0.3f}')
在我的电脑上,我得到了
bytes 100000 0.211
bytes 200000 0.826
bytes 300000 1.953
bytes 400000 3.514
memoryview 100000 0.021
memoryview 200000 0.052
memoryview 300000 0.043
memoryview 400000 0.077
您可以清楚地看到重复字符串切片的二次复杂度。即使只有 400000 次迭代,它已经无法管理。同时,memoryview
版本具有线性复杂度,速度极快。
编辑:请注意,这是在 CPython 中完成的。 There was a bug in Pypy up to 4.0.1 that caused memoryviews to have quadratic performance.
关于python - Python中的memoryview到底是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18655648/
我在 cython 中创建了一个类型化的内存 View ,并想将它乘以一个标量: import numpy as np import math cimport numpy as np def foo(
我在尝试使用 Cython 的内存 View 时遇到段错误。这是我的代码: def fock_build_init_with_inputs(tei_ints): # set the numb
我已经开始在 cython 中使用 memoryviews 来访问 numpy 数组。它们具有的各种优点之一是它们比旧的 numpy 缓冲区支持快得多: http://docs.cython.org/
我目前正在我的 Cython pyx 文件中设置我的 MemoryView,如下所示: @cython.boundscheck(False) cdef int[:] fill_memview():
什么时候应该在 Python2.7 中使用 memoryview?我只是找不到通过常规 bytearray 使用它的任何好处。此外,memoryview 不支持字符串方法,这使其完全无法使用。我错了吗
即使是非常小的简单整数数组也会出现奇怪的行为。 %%cython import numpy as np cimport cython cimport numpy as np def hi():
我想用尽可能少的副本快速填充从 C 递增接收的一长串结构。 如果我的结构只有主要数据类型,如下所示: cdef packed struct oh_hi: int lucky char
考虑这个虚拟的 Cython 代码: #!python #cython: boundscheck=False #cython: wraparound=False #cython: initialize
是否有一种纯 Python 的方式来转置 memoryview ? python memoryviews可以表示的不仅仅是一维字节 block 。它们可以表示多维布局、非连续内存、复杂元素类型等。例如
基本上: 如果我在某处声明一个字节数组: arr = bytearray(somestr) 然后创建它的内存 View : view = memoryview(arr) 我能否确定只要我在某处引用了
我正在尝试通过套接字接收一系列 protobuf;我不会提前知道数据量。我发送了相当数量的邮件,需要 buffer the messages当我收到它们时(以确保我收到所有消息)。我想利用 Pytho
我正在尝试使用 python 开发一个小型卷积神经网络框架。卷积节点的代码已经可以运行(速度很慢),我想加快速度。热点是卷积滤波器在图像上移动的循环。我选择使用 cython 来加速这些循环。 明显的
我打算在 python 数组中使用 memoryview: ... cdef double[:, :] a = np.array([[1, 1, 0]]) cdef double[:, :] c =
我在 Cython 中有一个需要数组指针的函数,例如带签名 cdef void foo(DTYPE_t* x) 和一个接收类型化内存 View 的函数,我想从中调用第一个函数,例如: def bar(
所以我有这个代码 buffer_size = 190000000 start_offset = 0 b = bytearray(buffer_size) mv = memoryview(b) end_
在 Python 3 中,执行: memoryview("this is a string") 产生错误: TypeError: memoryview: str object does not hav
我知道这个question ,但我一直在寻找一种更简单的方法来从 C 数组生成二维内存 View 。由于我是 C 和 Cython 新手,有人可以解释一下为什么会这样吗 cdef int[:, :]
我在 Cython 中创建简单的类时遇到问题。与处理 C++ 包装器中数组的内存 View 相关的文档很少。我想创建一个具有时间、x、y 和 z 属性的数据类。我需要这些属性是数组,最终可以在 Pyt
我有一个声明如下的 C 函数: void getIndexOfState(long *p, long C, long G, long B, long *state); 现在我的 cython 包装器代
我一直在用 cython 编写一些 python 扩展模块。我编写的扩展构建并运行良好。然后,我想在访问我的 numpy 数组时使用类型化的内存 View ,因为它们似乎有几个优点 http://do
我是一名优秀的程序员,十分优秀!