gpt4 book ai didi

python - pyspark:合并(外连接)两个数据框

转载 作者:太空狗 更新时间:2023-10-29 18:22:55 24 4
gpt4 key购买 nike

我有以下两个数据框:

DF1:

Id | field_A | field_B | field_C | field_D
1 | cat | 12 | black | 11
2 | dog | 128 | white | 19
3 | dog | 35 | yellow | 20
4 | dog | 21 | brown | 4
5 | bird | 10 | blue | 7
6 | cow | 99 | brown | 34

DF2:

Id | field_B | field_C | field_D | field_E
3 | 35 | yellow | 20 | 123
5 | 10 | blue | 7 | 454
6 | 99 | brown | 34 | 398

我希望得到 new_DF 作为

    Id | field_A | field_B | field_C | field_D | field_E
1 | cat | 12 | black | 11 |
2 | dog | 128 | white | 19 |
3 | dog | 35 | yellow | 20 | 123
4 | dog | 21 | brown | 4 |
5 | bird | 10 | blue | 7 | 454
6 | cow | 99 | brown | 34 | 398

这可以通过数据框操作来实现吗?谢谢!

最佳答案

试试这个:

new_df = df1.join(df2, on=['field_B', 'field_C', 'field_D'], how='left_outer')

关于python - pyspark:合并(外连接)两个数据框,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38063657/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com