gpt4 book ai didi

python - 将带有整数键的字典转换为 numpy 数组

转载 作者:行者123 更新时间:2023-12-01 04:16:04 24 4
gpt4 key购买 nike

我有一个字典定义如下:

>>> mydict = {0:obj0,5:obj1,4:obj3,7:obj4}

字典以整数作为键。

我正在尝试将此字典转换为 numpy 数组。

这样:

>>> nparray[[4,0]] = [obj3,obj0]
>>> nparray[[7,4]] = [obj4,obj3]

我知道 numpy 结构化数组,但不幸的是,似乎整数索引必须对应于数组中的位置而不是键。有没有办法改变这种行为。

我正在考虑一种“欺骗”numpy 数组的方法。例如,它不是读取 [4,0],而是读取与这些键对应的行。

如果没有其他选择,我的最终目标是拥有某种继承自 np.ndarray 的自定义类。

更新

更多背景知识,我最初通过使用下面的类来解决这个问题,它存储对象:

class MyArray (dict):
def __init__ (self,*args):
dict.__init__(self,*args)
def __getitem__ (self, key):
if not hasattr (key, '__iter__'):
return dict.__getitem__ (self,key)
return List([dict.__getitem__ (self,k) for k in key])

允许多键索引。键数组可能非常巨大(1000000+),因此for k in key可能需要很长时间和/或成本高昂。我想使用 numpy 数组来利用它的速度、较低的内存等优势,而不必使用 for 循环。仍然有保证吗?

最佳答案

让我们制作字典;这里我的 obj 是元组(只是为了方便):

In [563]: mydict={0:(0,),5:(1,),4:(3,),7:(4,)}
In [564]: mydict
Out[564]: {0: (0,), 4: (3,), 5: (1,), 7: (4,)}

初始化一个足够大且 dtype=object 的数组:

In [565]: A=np.empty((8,),dtype=object)    
In [566]: A
Out[566]: array([None, None, None, None, None, None, None, None], dtype=object)

将值从 mydict 复制到 A,使用键作为数组索引:

In [567]: for k in mydict:
.....: A[k]=mydict[k]
.....:

In [568]: A
Out[568]: array([(0,), None, None, None, (3,), (1,), None, (4,)], dtype=object)

In [574]: A[[4,0]]
Out[574]: array([(3,), (0,)], dtype=object)
In [575]: A[[7,4]]
Out[575]: array([(4,), (3,)], dtype=object)

字典中定义的项目现在出现在数组中相应的槽中。我不会声称这是有用的。

<小时/>

我可以掩盖

In [581]: Am=np.ma.masked_array(A)
In [582]: Am.mask=[False,True,True,True,False,False,True,False]

In [583]: Am
Out[583]:
masked_array(data = [(0,) -- -- -- (3,) (1,) -- (4,)],
mask = [False True True True False False True False],
fill_value = ?)

仍然存在,只是“隐藏”了。我不知道屏蔽是否对对象类型有任何有用的作用。

<小时/>

子类字典

从评论来看,您想要的主要功能是能够从字典中选择多个项目,类似于数组 A[[0,3,5]] 索引。

子类化 dict 可能比扩展或子类化 np.ndarray 更容易。

scipy.sparse 具有稀疏矩阵格式,它是 dict 的子类。它的 __getitem__ 可能会提供有关如何扩展您自己的字典的想法。我会尝试想出一个更简单的版本。

同时,获取一组键的一种方法是使用如下表达式:

In [646]: {k:mydict[k] for k in mydict if k in {0,4}}
Out[646]: {0: (0,), 4: (3,)}

或更简单

In [647]: {k:mydict[k] for k in [0,4]}
Out[647]: {0: (0,), 4: (3,)}

但更强大:

In [649]: {k:mydict.get(k,None) for k in [0,4,5,10]}
Out[649]: {0: (0,), 4: (3,), 5: (1,), 10: None}

关于python - 将带有整数键的字典转换为 numpy 数组,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34301722/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com