gpt4 book ai didi

database - 针对不断变化的大型数据集发出实时警报

转载 作者:可可西里 更新时间:2023-11-01 14:33:12 29 4
gpt4 key购买 nike

我有一个庞大的数据集,我必须监控其中的异常情况并发送警报。最接近我正在尝试做的例子如下。

假设关系数据库中有一个股票表:

stocks:
id
date
stock_name
price

假设我们正在处理一百万只股票。白天,股票价格根据持续和频繁的实时信息不断更新。在一天结束时,每只股票的最后记录价格是当天的收盘价。第二天,我们向表中添加另外一百万条记录并再次开始处理它。

假设用户可以配置如下警报:“当 AAPL 的走势超过过去 10 天的平均值 10% 时,提醒我”“当任何股票在过去 10 天内的波动幅度超过其平均水平的 10% 时,提醒我”

我们需要满足来自不同用户的 100 条提醒。持续轮询并尝试定期匹配警报是不切实际的。

您将如何实现?如果我们需要走大数据路线,什么样的数据存储/缓存有利于此类问题。我知道这是一个非常开放的问题,但我正在寻找有关如何解决类似问题以及使用哪些工具集的方向。

最佳答案

这听起来像是流处理器的用例,例如 Apache FlinkApache Storm . Flink 和 Storm 都是可扩展的分布式系统。他们通过以低延迟(数百毫秒,取决于程序复杂性)连续运行的程序来摄取数据流并分析数据。例如,您可以过滤流、定义时间窗口以计算特定时间范围内(过去 30 分钟或 10 天)的聚合,或组合多个数据流。

关于database - 针对不断变化的大型数据集发出实时警报,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34210715/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com