gpt4 book ai didi

「Python实用秘技15」pandas中基于范围条件进行表连接

转载 作者:我是一只小鸟 更新时间:2023-07-08 22:31:48 25 4
gpt4 key购买 nike

本文完整示例代码及文件已上传至我的 Github 仓库 https://github.com/CNFeffery/PythonPracticalSkills 。

  这是我的系列文章 「Python实用秘技」 的第15期,本系列立足于笔者日常工作中使用 Python 积累的心得体会,每一期为大家带来一个几分钟内就可学会的简单小技巧.

  作为系列第15期,我们即将学习的是:在 pandas 中基于范围条件进行表连接.

  表连接是我们日常开展数据分析过程中很常见的操作,在 pandas 中基于 join() 、 merge() 等方法,可以根据左右表连接依赖字段之间对应值是否相等,来实现常规的表连接.

  但在有些情况下,我们可能需要基于一些“特殊”的条件匹配,来完成左右表之间的表连接操作,譬如对于下面的示例数据框 demo_left 和 demo_right :

  假如我们需要基于 demo_left 的 left_id 等于 demo_right 的 right_id ,且 demo_left 的 datetime 与 demo_right 的 datetime 之间相差不超过7天,这样的条件来进行表连接, 通常的做法 是先根据 left_id 和 right_id 进行连接,再在初步连接的结果表中基于 left_id 或 right_id 进行分组筛选运算,过滤掉时间差大于7天的记录:

  而除了上面的方式以外,我们还可以基于之前的文章中给大家介绍过的 pandas 的功能拓展库 pyjanitor 中的 条件连接方法 ,直接基于范围比较进行连接,且该方式还支持 numba 加速运算:

  更多有关 pyjanitor 的使用技巧请移步 https://pyjanitor-devs.github.io/pyjanitor/ 阅读更多.


  本期分享结束,咱们下回见~👋 。

最后此篇关于「Python实用秘技15」pandas中基于范围条件进行表连接的文章就讲到这里了,如果你想了解更多关于「Python实用秘技15」pandas中基于范围条件进行表连接的内容请搜索CFSDN的文章或继续浏览相关文章,希望大家以后支持我的博客! 。

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com