gpt4 book ai didi

python - 创建 numpy 数组时 dtype=object 是什么意思?

转载 作者:行者123 更新时间:2023-12-03 02:56:08 24 4
gpt4 key购买 nike

我正在尝试 numpy 数组并创建了一个 numpy 字符串数组:

ar1 = np.array(['avinash', 'jay'])

正如我从他们的官方指南中读到的那样,numpy 数组上的操作会传播到各个元素。所以我这样做了:

ar1 * 2

但是我收到了这个错误:

TypeError                                 Traceback (most recent call last)
<ipython-input-22-aaac6331c572> in <module>()
----> 1 ar1 * 2

TypeError: unsupported operand type(s) for *: 'numpy.ndarray' and 'int'

但是当我使用dtype=object

ar1 = np.array(['avinash', 'jay'], dtype=object)

在创建数组时,我可以执行所有操作。

谁能告诉我为什么会这样?

最佳答案

NumPy 数组存储为连续的内存块。它们通常具有单一数据类型(例如整数、 float 或固定长度字符串),然后内存中的位被解释为具有该数据类型的值。

使用dtype=object创建数组是不同的。数组占用的内存现在充满了指向 Python 对象的指针,这些对象存储在内存中的其他位置(很像 Python 列表实际上是只是指向对象的指针列表,而不是对象本身)。

算术运算符(例如 *)不适用于具有 string_ 数据类型的数组(例如 ar1)(有特殊函数 -见下文)。 NumPy 只是将内存中的位视为字符,而 * 运算符在这里没有意义。然而,这条线

np.array(['avinash','jay'], dtype=object) * 2

之所以有效,是因为现在该数组是一个 Python 字符串(指向)的数组。 * 运算符针对这些 Python 字符串对象进行了明确定义。新的 Python 字符串会在内存中创建,并返回一个新的 object 数组,其中包含对新字符串的引用。

<小时/>

如果您有一个具有 string_unicode_ dtype 的数组,并且想要重复每个字符串,则可以使用 np.char.multiply:

In [52]: np.char.multiply(ar1, 2)
Out[52]: array(['avinashavinash', 'jayjay'],
dtype='<U14')

NumPy 还有许多其他 vectorised string methods也是。

关于python - 创建 numpy 数组时 dtype=object 是什么意思?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29877508/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com