gpt4 book ai didi

如果值相同,Python Pandas 将列从 df 复制到另一个

转载 作者:太空宇宙 更新时间:2023-11-03 12:55:41 24 4
gpt4 key购买 nike

我有两个数据框:

东方一号:

ID     A    B    C
1 x y z
1 x y z
2 x y z
2 x y z
2 x y z
3 x y z

DF 2:

ID     D    E    F
1 a b c1
2 a b c2
3 a b c3

我想以 DF TWO 中的 E 列为例,并将其放在 DF ONE 上,如果 ID 相同,那么之后我将得到以下输出:

ID     A    B    C    F
1 x y z c1
1 x y z c1
2 x y z c2
2 x y z c2
2 x y z c2
3 x y z c3

谢谢你的帮助

最佳答案

您可以使用 map通过 dict:

d = df2.set_index('ID')['F'].to_dict()
print (d)
{1: 'c1', 2: 'c2', 3: 'c3'}

df1['F'] = df1['ID'].map(d)
print (df1)
ID A B C F
0 1 x y z c1
1 1 x y z c1
2 2 x y z c2
3 2 x y z c2
4 2 x y z c2
5 3 x y z c3

另一种解决方案是 map by Series:

s = df2.set_index('ID')['F']
print (s)
ID
1 c1
2 c2
3 c3
Name: F, dtype: object

df1['F'] = df1['ID'].map(s)
print (df1)
ID A B C F
0 1 x y z c1
1 1 x y z c1
2 2 x y z c2
3 2 x y z c2
4 2 x y z c2
5 3 x y z c3

时间:

#[60000 rows x 5 columns]
df1 = pd.concat([df1]*10000).reset_index(drop=True)

In [115]: %timeit pd.merge(df1, df2[['ID', 'F']],how='left')
100 loops, best of 3: 11.1 ms per loop

In [116]: %timeit df1['ID'].map(df2.set_index('ID')['F'])
100 loops, best of 3: 3.18 ms per loop

In [117]: %timeit df1['ID'].map(df2.set_index('ID')['F'].to_dict())
100 loops, best of 3: 3.36 ms per loop

In [118]: %timeit df1['ID'].map({k:v for k, v in df2[['ID', 'F']].as_matrix()})
100 loops, best of 3: 3.44 ms per loop

In [119]: %%timeit
...: df2.index = df2['ID']
...: df1['F1'] = df1['ID'].map(df2['F'])
...:
100 loops, best of 3: 3.33 ms per loop

关于如果值相同,Python Pandas 将列从 df 复制到另一个,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43491868/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com