gpt4 book ai didi

python - ndarray 到 Structured_array 和 float 到 int

转载 作者:行者123 更新时间:2023-12-01 05:28:57 25 4
gpt4 key购买 nike

我遇到的问题是,通过使用ndarray.view(np.dtype)从经典 ndarray 获取结构化数组似乎错误计算了 floatint转换。

示例更能说明问题:

In [12]: B
Out[12]:
array([[ 1.00000000e+00, 1.00000000e+00, 0.00000000e+00,
0.00000000e+00, 4.43600000e+01, 0.00000000e+00],
[ 1.00000000e+00, 2.00000000e+00, 7.10000000e+00,
1.10000000e+00, 4.43600000e+01, 1.32110000e+02],
[ 1.00000000e+00, 3.00000000e+00, 9.70000000e+00,
2.10000000e+00, 4.43600000e+01, 2.04660000e+02],
...,
[ 1.28900000e+03, 1.28700000e+03, 0.00000000e+00,
9.99999000e+05, 4.75600000e+01, 3.55374000e+03],
[ 1.28900000e+03, 1.28800000e+03, 1.29000000e+01,
5.40000000e+00, 4.19200000e+01, 2.08400000e+02],
[ 1.28900000e+03, 1.28900000e+03, 0.00000000e+00,
0.00000000e+00, 4.19200000e+01, 0.00000000e+00]])

In [14]: B.view(A.dtype)
Out[14]:
array([(4607182418800017408, 4607182418800017408, 0.0, 0.0, 44.36, 0.0),
(4607182418800017408, 4611686018427387904, 7.1, 1.1, 44.36, 132.11),
(4607182418800017408, 4613937818241073152, 9.7, 2.1, 44.36, 204.66),
...,
(4653383897399164928, 4653375101306142720, 0.0, 999999.0, 47.56, 3553.74),
(4653383897399164928, 4653379499352653824, 12.9, 5.4, 41.92, 208.4),
(4653383897399164928, 4653383897399164928, 0.0, 0.0, 41.92, 0.0)],
dtype=[('i', '<i8'), ('j', '<i8'), ('tnvtc', '<f8'), ('tvtc', '<f8'), ('tf', '<f8'), ('tvps', '<f8')])

“i”和“j”列是真整数:

这里你还有我所做的两项进一步检查,问题似乎来自ndarray.view(np.int)

In [21]: B[:,:2]
Out[21]:
array([[ 1.00000000e+00, 1.00000000e+00],
[ 1.00000000e+00, 2.00000000e+00],
[ 1.00000000e+00, 3.00000000e+00],
...,
[ 1.28900000e+03, 1.28700000e+03],
[ 1.28900000e+03, 1.28800000e+03],
[ 1.28900000e+03, 1.28900000e+03]])

In [22]: B[:,:2].view(np.int)
Out[22]:
array([[4607182418800017408, 4607182418800017408],
[4607182418800017408, 4611686018427387904],
[4607182418800017408, 4613937818241073152],
...,
[4653383897399164928, 4653375101306142720],
[4653383897399164928, 4653379499352653824],
[4653383897399164928, 4653383897399164928]])

In [23]: B[:,:2].astype(np.int)
Out[23]:
array([[ 1, 1],
[ 1, 2],
[ 1, 3],
...,
[1289, 1287],
[1289, 1288],
[1289, 1289]])

我做错了什么?由于 numpy 分配内存,我无法更改类型吗?还有另一种方法可以做到这一点(fromarrays,正在指责 shape mismatch

最佳答案

这是执行 somearray.view(new_dtype) 和调用 astype 之间的区别。

你所看到的正是预期的行为,而且是经过深思熟虑的,但当你第一次遇到它时,它会让人感到愤怒。

具有不同数据类型的 View 将数组的底层内存缓冲区解释为给定的数据类型。不制作任何副本。它非常强大,但你必须明白你在做什么。

要记住的关键一点是,调用 view 永远不会改变底层内存缓冲区,只会改变 numpy 查看它的方式(例如 dtype、shape、strides)。因此,view故意避免将数据更改为新类型,而只是将“旧位”解释为新数据类型。

例如:

In [1]: import numpy as np

In [2]: x = np.arange(10)

In [3]: x
Out[3]: array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [4]: x.dtype
Out[4]: dtype('int64')

In [5]: x.view(np.int32)
Out[5]: array([0, 0, 1, 0, 2, 0, 3, 0, 4, 0, 5, 0, 6, 0, 7, 0, 8, 0, 9, 0],
dtype=int32)

In [6]: x.view(np.float64)
Out[6]:
array([ 0.00000000e+000, 4.94065646e-324, 9.88131292e-324,
1.48219694e-323, 1.97626258e-323, 2.47032823e-323,
2.96439388e-323, 3.45845952e-323, 3.95252517e-323,
4.44659081e-323])

如果您想使用新的数据类型创建数组的副本,请改用 astype:

In [7]: x
Out[7]: array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [8]: x.astype(np.int32)
Out[8]: array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9], dtype=int32)

In [9]: x.astype(float)
Out[9]: array([ 0., 1., 2., 3., 4., 5., 6., 7., 8., 9.])
<小时/>

但是,将 astype 与结构化数组一起使用可能会让您感到惊讶。结构化数组将输入的每个元素视为类似 C 的结构。因此,如果您调用 astype,您将会遇到一些意外。

<小时/>

基本上,您希望列具有不同的数据类型。在这种情况下,不要将它们放在同一个数组中。 Numpy 数组预计是同质的。结构化数组在某些情况下很方便,但如果您正在寻找处理单独数据列的东西,它们可能不是您想要的。只需将每一列用作自己的数组即可。

更好的是,如果您正在使用表格数据,您可能会发现使用 pandas 比直接使用 numpy 数组更容易。 pandas 面向表格数据(其中列应具有不同的类型),而 numpy 面向同质数组。

关于python - ndarray 到 Structured_array 和 float 到 int,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20746950/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com