gpt4 book ai didi

python - 如何将数据帧一列的所有元素设置为数组?

转载 作者:太空宇宙 更新时间:2023-11-03 21:07:30 25 4
gpt4 key购买 nike

我只是想知道如何将数据帧的一列的所有元素设置为 Pandas 中的数组。

就像这样,第一列和第二列

  a b c d   one    two
0 1 2 3 4 [1, 2] [1, 2]
1 2 2 3 4 [2, 2] [2, 2]
2 3 2 3 4 [3, 2] [3, 2]

我已经尝试过了,但只能这样:

d['one']=[[1,2],[2,2],[3,2]]

如果我想使用 numpy 数组而不是 python 内置数组,例如:

d['one']=np.array([[1,2],[2,2],[3,2]])

它涉及:

  a b c d one  two
0 1 2 3 4 1 [1, 2]
1 2 2 3 4 2 [2, 2]
2 3 2 3 4 3 [3, 2]

或者我想一次将一列设置为同一个数组,例如,

d['one']=[1,2], or d['c']=[1,2]

像这样:

  a b c d   one    two
0 1 2 3 4 [1, 2] [1, 2]
1 2 2 3 4 [1, 2] [2, 2]
2 3 2 3 4 [1, 2] [3, 2]

有错误:

ValueError:值的长度与索引的长度不匹配

另外,如果我想根据条件将 b 列的值更改为数组,我发现我无法做到这一点。因为我需要使用条件,所以存在一个赋值操作的序列,这意味着我无法将列设置为这样的数组:

d['b']=[[1,2],[6,7],[6,7]]

,一次。我需要一步一步来。

例如,首先将b列设置为[1,2],其中a=1,

d.loc[d['a']==1,'b']=[1,2]
a b c d one two
0 1 [1,2] 3 4 [1, 2] [1, 2]
1 2 2 3 4 [2, 2] [2, 2]
2 3 2 3 4 [3, 2] [3, 2]

然后将b列设置为[6,7],[6,7],其中a=2或a=3,

d.loc[(d['a']==2)|(d['a']==3),'b']=[6,7]
a b c d one two
0 1 [1,2] 3 4 [1, 2] [1, 2]
1 2 [6,7] 3 4 [2, 2] [2, 2]
2 3 [6,7] 3 4 [3, 2] [3, 2]

前一个有错误:

使用可迭代对象进行设置时,必须具有相同的 len 键和值

如果我用另一种方式来做:

d['b'][0]=[1,2]

也有错误:

ValueError:使用序列设置数组元素。

后一个结果是:

  a b c d   one    two
0 1 2 3 4 [1, 2] [1, 2]
1 2 6 3 4 [2, 2] [2, 2]
2 3 7 3 4 [3, 2] [3, 2]

,这不是我想要的,那么怎么写才能达到这样的效果呢?

总结一下,

  1. 如何使用 numpy 数组来实现此目的?如何一次将一列设置为同一个数组?

  2. 如何根据条件将列的值更改为数组?

最佳答案

重现您的示例:

考虑数据框:

>> d = pd.DataFrame({'a': [1, 2, 3],
>> 'b': [2, 2, 2],
>> 'c': [3, 3, 3],
>> 'd': [4, 4, 4]})

您测试的代码生成一个列表列表,数据框将每个列表解释为一行的值:

>> d['one']=[[1,2],[2,2],[3,2]]
>> print(d['one'][0])
>> print(type(d['one'][0]))
[1, 2]
<class 'list'>

现在,将 numpy.array 存储到数据框中:

如果您构建一个数组列表,您将能够根据需要存储它:

>> two = [np.array([1,2]), np.array([2,2]),np.array([3,2])]
>> d['two']= two
>> print(d['two'][0])
>> print(type(d['two'][0]))
[1 2]
<class 'numpy.ndarray'>

为了方便此操作,您可以使用 lambda/apply 函数:

>> d['three'] = [[1,2],[2,2],[3,2]]
>> d['three'] = d['three'].apply(lambda x: tuple(x)).apply(np.array)
>> print(d['three'][0])
>> print(type(d['three'][0]))
[1 2]
<class 'numpy.ndarray'>

按照您的描述获取数据

要检查数组的第一个 value == 3 或列 two 是否与条件匹配,也使用 lambda/apply:

d[d.apply(lambda x: x['three'][0] == 3, axis=1)]
a b c d one two three
2 3 2 3 4 [3, 2] [3, 2] [3, 2]

关于python - 如何将数据帧一列的所有元素设置为数组?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55303980/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com