gpt4 book ai didi

python - 访问 numpy 元组数组中的第一项

转载 作者:太空宇宙 更新时间:2023-11-04 03:35:40 24 4
gpt4 key购买 nike

我有一个 pandas 数据框,其中有一列包含由两个 float 组成的元组,例如(1.1,2.2)。我希望能够生成一个包含每个元组第一个元素的数组。我可以遍历每一行并获取每个元组的第一个元素,但数据框包含近 400 万条记录,这种方法非常慢。 satoru 对 SO (stackoverflow.com/questions/6454894/reference-an-element-in-a-list-of-tuples) 的回答建议使用以下机制:

>>> import numpy as np
>>> arr = np.array([(1.1,2.2),(3.3,4.4),(5.5,6.6),(7.7,8.8)])
>>> arr
array([[ 1.1, 2.2],
[ 3.3, 4.4],
[ 5.5, 6.6],
[ 7.7, 8.8]])
>>> arr[:,0]
array([ 1.1, 3.3, 5.5, 7.7])

这样效果很好,绝对可以满足我的需求。但是,当我尝试从 pandas 数据帧创建一个 numpy 数组时,我遇到了这个问题。在这种情况下,上述解决方案将失败并出现各种错误。例如:

>>> import numpy as np
>>> import pandas as pd
>>> df = pd.DataFrame({'other':[0,0,0,1,1],'point':[(1.1,2.2),(3.3,4.4),(5.5,6.6),(7.7,8.8),(9.9,0.0)]})
>>> df
other point
0 0 (1.1, 2.2)
1 0 (3.3, 4.4)
2 0 (5.5, 6.6)
3 1 (7.7, 8.8)
4 1 (9.9, 0.0)
>>> arr2 = np.array(df['point'])
>>> arr2
array([(1.1, 2.2), (3.3, 4.4), (5.5, 6.6), (7.7, 8.8), (9.9, 0.0)], dtype=object)
>>> arr2[:,0]
IndexError: too many indices for array

或者:

>>> arr2 = np.array([df['point']])
>>> arr2
array([[[1.1, 2.2],
[3.3, 4.4],
[5.5, 6.6],
[7.7, 8.8],
[9.9, 0.0]]], dtype=object)
>>> arr2[:,0]
array([[1.1, 2.2]], dtype=object) # Which is not what I want!

当我将数据从 pandas 数据帧传输到 numpy 数组时,似乎出现了问题 - 但我不知道是什么问题。如有任何建议,我们将不胜感激。

最佳答案

从您的数据框开始,我可以提取一个 (5,2) 数组:

In [68]: df=pandas.DataFrame({'other':[0,0,0,1,1],'point':[(1.1,2.2),(3.3,4.4),(5.5,6.6),(7.7,8.8),(9.9,0.0)]})

In [69]: np.array(df['point'].tolist())
Out[69]:
array([[ 1.1, 2.2],
[ 3.3, 4.4],
[ 5.5, 6.6],
[ 7.7, 8.8],
[ 9.9, 0. ]])

df['point'] 是 Pandas 系列。

df['point'].values 返回形状为 (5,) 和数据类型为 object 的数组。我

array([(1.1, 2.2), (3.3, 4.4), (5.5, 6.6), (7.7, 8.8), (9.9, 0.0)], dtype=object)

实际上,它是一个元组数组。真正的元组,而不是类似元组的结构化数组。该数组实际上包含指向元组的指针,这些元组位于内存中的其他位置。它的形状是 (5,) - 它是一维数组,因此尝试将其作为二维数组进行索引会给您带来“太多”错误。 np.array([df['point']]) 只是将它包装在另一个维度中,没有解决基本的对象 dtype 问题。

tolist() 将其转换为元组列表,您可以从中构建二维数组。

将数据从对象数组复制到 n-d 数组并不简单,并且总是需要某种复制。数据缓冲区完全不同,因此 astype 之类的东西不起作用。

关于python - 访问 numpy 元组数组中的第一项,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29245187/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com