gpt4 book ai didi

python - 如何使用 Python 构建基于时间戳发生的序列?

转载 作者:行者123 更新时间:2023-12-01 08:18:39 24 4
gpt4 key购买 nike

我主要在一个数据库上使用 Python,该数据库有 17.000.000 条记录,对应 2.800.000 个唯一 ID。每个ID代表一个运输过程的一个事件,所有实例都有:ID、EVENT、TIMESTAMP(日期时间)。有一个事件通常但并不总是启动序列,并且有多种结果,即已交付、已返回等。

我的目标是找到每个 ID 最常见的路径,即事件发生的顺序是什么,并找出流程中的瓶颈。

是否有任何可视化工具可以与内置此结构的 Python 一起使用?您建议我如何处理这个问题?

谢谢

最佳答案

这不是 Python 的答案,但考虑到这个问题,我认为有更好的方法来执行此类分析。

不知道大家有没有听说过流程挖矿。但我认为它是适合您的情况的完美选择。基本上,流程挖掘包括分析流程的流程。我使用过不同的工具,其中一些是:

  • 迪斯科
  • ProM(开源)
  • 塞洛尼斯

基本上,您需要做的就是定义 ID 是什么(您已经拥有它),然后选择哪些列代表时间戳(您已经拥有它)和事件名称(您也拥有它)。

任何这些工具都能够为您提供完美的流程分析。哪一条是最常见的路径,每个事件的平均时间等。如果您添加更多属性,它甚至可以根据这些属性返回选择一条路径或另一条路径的原因。

关于python - 如何使用 Python 构建基于时间戳发生的序列?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54825811/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com