gpt4 book ai didi

python 将列表转换为 numpy 数组,同时保留数字格式

转载 作者:太空宇宙 更新时间:2023-11-04 05:09:57 25 4
gpt4 key购买 nike

我的目标是将我的数据转换为 numpy 数组,同时保留原始列表中的数字格式,清晰且正确。


例如,这是我的列表格式数据:

[[24.589888563639835, 13.899891781550952, 4478597, -1], [26.822224204095697, 14.670531752529088, 4644503, -1], [51.450405486761866, 54.770422572665254, 5570870, 0], [44.979065080591504, 54.998835550128852, 6500333, 0], [44.866399274880663, 55.757240813761534, 6513301, 0], [45.535380533604247, 57.790074517001365, 6593281, 0], [44.850372630818214, 54.720574554485822, 6605483, 0], [51.32738085400576, 55.118344981379266, 6641841, 0]]

当我将它转换为 numpy 数组时,

data = np.asarray(data)

我得到数学符号 e,如何在我的输出数组中保存相同的格式?

[[  2.45898886e+01   1.38998918e+01   4.47859700e+06  -1.00000000e+00]
[ 2.68222242e+01 1.46705318e+01 4.64450300e+06 -1.00000000e+00]
[ 5.14504055e+01 5.47704226e+01 5.57087000e+06 0.00000000e+00]
[ 4.49790651e+01 5.49988356e+01 6.50033300e+06 0.00000000e+00]
[ 4.48663993e+01 5.57572408e+01 6.51330100e+06 0.00000000e+00]
[ 4.55353805e+01 5.77900745e+01 6.59328100e+06 0.00000000e+00]
[ 4.48503726e+01 5.47205746e+01 6.60548300e+06 0.00000000e+00]
[ 5.13273809e+01 5.51183450e+01 6.64184100e+06 0.00000000e+00]]

更新:

我做到了:

np.set_printoptions(precision=6,suppress=True)

但是当我将部分数据传递给另一个变量然后查看它时,我仍然得到不同的数字,我发现小数点已经改变了!为什么它会在内部更改小数位,为什么它不能保持原样?

最佳答案

从嵌套列表创建简单数组:

In [133]: data = np.array(alist)
In [136]: data.shape
Out[136]: (8, 4)
In [137]: data.dtype
Out[137]: dtype('float64')

这是一个二维数组,8行,4列;所有元素都存储为 float 。

列表可以加载到结构化数组中,该数组被定义为具有 float 和整数字段的混合。请注意,对于此负载,我必须将“行”转换为元组。

In [139]: dt = np.dtype('f,f,i,i')
In [140]: dt
Out[140]: dtype([('f0', '<f4'), ('f1', '<f4'), ('f2', '<i4'), ('f3', '<i4')])
In [141]: data = np.array([tuple(row) for row in alist], dtype=dt)
In [142]: data.shape
Out[142]: (8,)
In [143]: data
Out[143]:
array([( 24.58988762, 13.89989185, 4478597, -1),
( 26.82222366, 14.67053223, 4644503, -1),
( 51.45040512, 54.77042389, 5570870, 0),
( 44.97906494, 54.99883652, 6500333, 0),
( 44.86639786, 55.7572403 , 6513301, 0),
( 45.53538132, 57.79007339, 6593281, 0),
( 44.85037231, 54.72057343, 6605483, 0),
( 51.32738113, 55.11834335, 6641841, 0)],
dtype=[('f0', '<f4'), ('f1', '<f4'), ('f2', '<i4'), ('f3', '<i4')])

您按名称而不是列号访问字段:

In [144]: data['f0']
Out[144]:
array([ 24.58988762, 26.82222366, 51.45040512, 44.97906494,
44.86639786, 45.53538132, 44.85037231, 51.32738113], dtype=float32)
In [145]: data['f3']
Out[145]: array([-1, -1, 0, 0, 0, 0, 0, 0], dtype=int32)

将这些值与二维 float 组中单列的显示进行比较:

In [146]: dataf = np.array(alist)
In [147]: dataf[:,0]
Out[147]:
array([ 24.58988856, 26.8222242 , 51.45040549, 44.97906508,
44.86639927, 45.53538053, 44.85037263, 51.32738085])
In [148]: dataf[:,3]
Out[148]: array([-1., -1., 0., 0., 0., 0., 0., 0.])

当混合使用 float 、整数、字符串或其他数据类型时,使用结构化数组更有意义。

但要备份一点——纯 float 版本有什么问题?为什么保留 2 列的整数标识很重要?

关于python 将列表转换为 numpy 数组,同时保留数字格式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43252197/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com