python - ndarray 到 Structured_array 和 float 到 int-6ren

python - ndarray 到 Structured_array 和 float 到 int

转载作者：行者123 更新时间：2023-12-01 05:28:57

25

4

我遇到的问题是，通过使用ndarray.view(np.dtype)从经典 ndarray 获取结构化数组似乎错误计算了 float至int转换。

示例更能说明问题:

In [12]: B
Out[12]: 
array([[  1.00000000e+00,   1.00000000e+00,   0.00000000e+00,
      0.00000000e+00,   4.43600000e+01,   0.00000000e+00],
   [  1.00000000e+00,   2.00000000e+00,   7.10000000e+00,
      1.10000000e+00,   4.43600000e+01,   1.32110000e+02],
   [  1.00000000e+00,   3.00000000e+00,   9.70000000e+00,
      2.10000000e+00,   4.43600000e+01,   2.04660000e+02],
   ..., 
   [  1.28900000e+03,   1.28700000e+03,   0.00000000e+00,
      9.99999000e+05,   4.75600000e+01,   3.55374000e+03],
   [  1.28900000e+03,   1.28800000e+03,   1.29000000e+01,
      5.40000000e+00,   4.19200000e+01,   2.08400000e+02],
   [  1.28900000e+03,   1.28900000e+03,   0.00000000e+00,
      0.00000000e+00,   4.19200000e+01,   0.00000000e+00]])

In [14]: B.view(A.dtype)
Out[14]: 
array([(4607182418800017408, 4607182418800017408, 0.0, 0.0, 44.36, 0.0),
   (4607182418800017408, 4611686018427387904, 7.1, 1.1, 44.36, 132.11),
   (4607182418800017408, 4613937818241073152, 9.7, 2.1, 44.36, 204.66),
   ...,
   (4653383897399164928, 4653375101306142720, 0.0, 999999.0, 47.56, 3553.74),
   (4653383897399164928, 4653379499352653824, 12.9, 5.4, 41.92, 208.4),
   (4653383897399164928, 4653383897399164928, 0.0, 0.0, 41.92, 0.0)], 
  dtype=[('i', '<i8'), ('j', '<i8'), ('tnvtc', '<f8'), ('tvtc', '<f8'), ('tf', '<f8'), ('tvps', '<f8')])

“i”和“j”列是真整数:

这里你还有我所做的两项进一步检查，问题似乎来自ndarray.view(np.int)

In [21]: B[:,:2]
Out[21]: 
array([[  1.00000000e+00,   1.00000000e+00],
   [  1.00000000e+00,   2.00000000e+00],
   [  1.00000000e+00,   3.00000000e+00],
   ..., 
   [  1.28900000e+03,   1.28700000e+03],
   [  1.28900000e+03,   1.28800000e+03],
   [  1.28900000e+03,   1.28900000e+03]])

In [22]: B[:,:2].view(np.int)
Out[22]: 
array([[4607182418800017408, 4607182418800017408],
   [4607182418800017408, 4611686018427387904],
   [4607182418800017408, 4613937818241073152],
   ..., 
   [4653383897399164928, 4653375101306142720],
   [4653383897399164928, 4653379499352653824],
   [4653383897399164928, 4653383897399164928]])

In [23]: B[:,:2].astype(np.int)
Out[23]: 
array([[   1,    1],
   [   1,    2],
   [   1,    3],
   ..., 
   [1289, 1287],
   [1289, 1288],
   [1289, 1289]])

我做错了什么？由于 numpy 分配内存，我无法更改类型吗？还有另一种方法可以做到这一点(fromarrays，正在指责 shape mismatch ？

最佳答案

这是执行 somearray.view(new_dtype) 和调用 astype 之间的区别。

你所看到的正是预期的行为，而且是经过深思熟虑的，但当你第一次遇到它时，它会让人感到愤怒。

具有不同数据类型的 View 将数组的底层内存缓冲区解释为给定的数据类型。不制作任何副本。它非常强大，但你必须明白你在做什么。

要记住的关键一点是，调用 view 永远不会改变底层内存缓冲区，只会改变 numpy 查看它的方式(例如 dtype、shape、strides)。因此，view故意避免将数据更改为新类型，而只是将“旧位”解释为新数据类型。

例如:

In [1]: import numpy as np

In [2]: x = np.arange(10)

In [3]: x
Out[3]: array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [4]: x.dtype
Out[4]: dtype('int64')

In [5]: x.view(np.int32)
Out[5]: array([0, 0, 1, 0, 2, 0, 3, 0, 4, 0, 5, 0, 6, 0, 7, 0, 8, 0, 9, 0],
              dtype=int32)

In [6]: x.view(np.float64)
Out[6]:
array([  0.00000000e+000,   4.94065646e-324,   9.88131292e-324,
         1.48219694e-323,   1.97626258e-323,   2.47032823e-323,
         2.96439388e-323,   3.45845952e-323,   3.95252517e-323,
         4.44659081e-323])

如果您想使用新的数据类型创建数组的副本，请改用 astype:

In [7]: x
Out[7]: array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [8]: x.astype(np.int32)
Out[8]: array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9], dtype=int32)

In [9]: x.astype(float)
Out[9]: array([ 0.,  1.,  2.,  3.,  4.,  5.,  6.,  7.,  8.,  9.])

<小时/>

但是，将 astype 与结构化数组一起使用可能会让您感到惊讶。结构化数组将输入的每个元素视为类似 C 的结构。因此，如果您调用 astype，您将会遇到一些意外。

<小时/>

基本上，您希望列具有不同的数据类型。在这种情况下，不要将它们放在同一个数组中。 Numpy 数组预计是同质的。结构化数组在某些情况下很方便，但如果您正在寻找处理单独数据列的东西，它们可能不是您想要的。只需将每一列用作自己的数组即可。

更好的是，如果您正在使用表格数据，您可能会发现使用 pandas 比直接使用 numpy 数组更容易。 pandas 面向表格数据(其中列应具有不同的类型)，而 numpy 面向同质数组。

关于python - ndarray 到 Structured_array 和 float 到 int，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/20746950/

25

4

0

文章推荐： python - 无法使用 Python 3 的请求登录

文章推荐： javascript - 从父级访问由 ng-repeat 填充的元素的方法

文章推荐： python - 使用 Python Flask 将数据从 GET 请求传递到 POST 请求

python - 如何将一维 ndarray 列表转换为二维 ndarray (mxnet ndarray)
在这个例子中，我有一个一维 ndarray 列表，长度为 9，列表有 9 个元素，每个元素有 shape=(2048,) ，所以完全9 * (2048,) , 我得到这些 ndarray来自 mxne
python - NumPy ndarray.all() vs np.all(ndarray) vs all(ndarray)
Python/NumPy 中的三种“全部”方法有什么区别？性能差异的原因是什么？ ndarray.all() 是否总是三者中最快的？这是我运行的计时测试: In [59]: a = np.full(
python - `ndarray.flags[' OWNDATA' ]`, ` ndarray.base`、 `id(ndarray)` 和 `ndarray.__array_interface__[' data']` 有什么不同？
我似乎在 this 中遇到了 XY 问题关于如何判断数组是否共享相同内存的问题。我检查的方式是错误的，我不知道为什么。举几个例子 test = np.ones((3,3)) test2 = np.a
python - MXNET - 数据类型 '' 无效，应为 NDArray、numpy.ndarray、
我在使用 mxnet 进行基本 IO 方面遇到问题。我正在尝试使用 mxnet.io.NDArrayIter 读取内存数据集以在 mxnet 中进行训练。我有下面的代码(为了简洁而精简)，它预处理代码
python - Numpy:需要最有效的方法来处理 1D ndarray 中的选择元素，使用 2D ndarray 的映射，以输出 1D 平均 ndarray
首先，这不是作业问题；而是作业问题。它是与我的工作相关的实际问题的抽象。我真的很感谢所有的意见! 我需要运行类似于下面的计算，按顺序运行数万次，它的计算时间显着影响我的模拟的总持续时间: 在这个抽象中
python - 根据坐标列表从 ndarray 构造一个 ndarray
这个问题在这里已经有了答案: Index multidimensional array with index array (1 个回答) 关闭 2 年前。我想根据一些坐标从 src ndarray
numpy-ndarray - 如何将索引相关函数应用于 numpy ndarray？
因此 numpy ndarray 非常方便，因为您只需为任何一维函数 f 和任何 ndarray A 输入 f(A) 即可，它将按元素应用 f。有人告诉我，这也是将函数应用于 ndarray 并避免
python - 将 ndarray 字符串转换为 ndarray
我有一个 ndarray 字符串。我想将它转换回 ndarray。我尝试了 newval = np.fromstring(val, dtype=float) 。但它给出了ValueError:字符串大
python - 如何用另一个 ndarray 索引一个 ndarray ？
我正在 python/numpy 中做一些机器学习工作，其中我想用一维 ndarray 索引一个二维 ndarray，这样我就可以得到一个带有索引值的一维数组。我让它与一些丑陋的代码一起工作，我想知
python - 使用索引数组从任意维的 ndarray 中提取 2d ndarray
我想根据某些维度的索引位置数组提取 numpy ndarray 的一部分。让我用一个例子来说明这一点示例数据 dummy = np.random.rand(5,2,100) X = np.array
python - 如何在另一个 ndarray 中找到一个 ndarray 的索引
这个问题在这里已经有了答案: Find the row indexes of several values in a numpy array (8 个答案) 关闭 2 年前。我有 a = np.a
Python:如何将 ndarray 转换为 ndarray 列表
我想提取 numpy.ndarray 的第一个轴成为numpy.ndarray的列表. 例如，arr_A包含形状为 (3, 100, 200) 的 numpy ndarray，它将转换为形状为 (10
python - 将数组的数组转换为 NumPy 的 ndarray of ndarrays
我一直在尝试用 ndarrays 的 numpy ndarray 转换数组数组。这是我的数据类型: dt = 'i8,i8,i8,i8,i8,i8,i8,i8,i8,i8,i8,i8,i8,f8,i
python - 用于将 ndarray 拆分为更小的重叠 ndarray 的滑动窗口
我目前正在研究一种可以拆分 numpy.ndarray 的方法进入给定数量的子阵列，只要该数量小于窗口移动的轴。示例: 给定一个形状为 (15, 40, 3) 的 numpy.ndarray 我想分
python - 查找落在另一个 ndarray 中的 ndarray 的点
我用 arcpy 模块创建了一个 NumPy 结构化数组(称为 arr): arr = arcpy.da.FeatureClassToNumPyArray('MPtest','SHAPE@XYZ',e
python - 引用 ndarray 中的 ndarray 行
是否可以将一个 numpy 数组的特定行的引用存储在另一个 numpy 数组中？我有一个二维节点数组，例如 nodes = np.array([[1, 2], [2, 3], [3, 4], [4,
python - 将两个系列合并/压缩到 ndarray 的 ndarray
我有两个长度相同的 pandas 系列，如下所示: S1 = 0 -0.483415 1 -0.514082 2 -0.515724 3 -0.519375 4
python - 从之前的 ndarray.tobytes() 转换回 ndarray？
当使用 numpy 时，假设我有一个任意的、以前创建的名为 my_ndarray 的 ndarray。如果可能的话，我希望能够执行以下操作...... my_bytes = my_ndarray.to
python - 为什么从一个 ndarray 复制到另一个 ndarray 内存消耗？
我在尝试使用 numpy 打乱多维数组时遇到问题。可以使用以下代码重现该问题: import numpy as np s=(300000, 3000) n=s[0] print ("Allocate"
python - 'numpy.ndarray' 对象如何不 'numpy.ndarray' 对象？
当您调用 DataFrame.to_numpy() 时，pandas 将找到可以容纳 DataFrame 中所有数据类型的 NumPy 数据类型。但是如何进行反向操作呢？我有一个“numpy.nda

首页

博学

6Ren·AI

商城

python - ndarray 到 Structured_array 和 float 到 int