gpt4 book ai didi

python - 检查 pandas 数据框中的哪些值不在 SQL 数据库中

转载 作者:行者123 更新时间:2023-11-29 03:15:50 25 4
gpt4 key购买 nike

我想检查 pandas 数据框中的哪些值不在 SQL 数据库中。所以基本上是一个左连接(左边是 pandas df),其中右边的(SQL DB)键是 NULL。

数据库很大,大约有 500 万个条目,但我只对主键感兴趣。

Pandas 数据框(50k 行)比 SQL DB(5M)小得多,所以我会而是将数据移动到带来所有数据的数据库

我考虑过在 SQL 中创建一个临时表并进行 LEFT JOIN,但只用一个查询就可以做到这一点

Pandas 数据框:

    index   
0
1
2
3
4

sql数据库:

    index(primary key)     
1
2
3

结果:0, 4

最佳答案

我想知道什么是“batabase”...谷歌没有帮助我:-)

但是,如果我理解正确的话,我认为您应该在 SQL Server 中从数据帧中创建一个单列临时表(正如您自己建议的那样),然后当然可以很容易地找到它:

SELECT P.Index 
FROM PandasTable as P
WHERE P.Index NOT IN
(SELECT B.Index FROM BatabaseTable)

使用索引主键应该很快。

关于python - 检查 pandas 数据框中的哪些值不在 SQL 数据库中,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56993063/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com