gpt4 book ai didi

python - 如何在不创建数据副本的情况下进行 pd.merge?

转载 作者:行者123 更新时间:2023-12-03 22:43:59 25 4
gpt4 key购买 nike

我正在尝试将两个数据框连接在一起,如下所示:

df3 = pd.merge(df1,df2, how='inner', on='key')
其中 df1 和 df2 是具有数百万行的大型数据集。基本上我如何加入他们而不必创建第三个数据帧 df3.
我只想加入一个到下一个,改变原来的。我没有足够的内存在我的服务器上运行这么多,所以我需要更高效的东西。

最佳答案

你可以试试这个。我不确定你的数据是什么样子的,所以只是猜测。

import pandas as pd

def merge_dataset(df1, df2):
df1 = df1.merge(df2, how='inner', on='key')
print(df1)
return df1

if __name__ == '__main__':

d1 = {'col1': [1, 2], 'key': [3, 4]}
d2 = {'col2': [5,6], 'key': [3, 4]}
df1 = pd.DataFrame(data=d1)
df2 = pd.DataFrame(data=d2)
# Debug
print(df1)
print(df2)
merge_dataset(df1, df2)

关于python - 如何在不创建数据副本的情况下进行 pd.merge?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53721213/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com