gpt4 book ai didi

database - 我可以在 Apache Spark 上运行时间序列数据库 (TSDB) 吗?

转载 作者:太空狗 更新时间:2023-10-30 01:52:08 26 4
gpt4 key购买 nike

我开始学习大数据和Apache Spark我有疑问。

将来我需要从 IoT 收集数据,这些数据将以 time series data 的形式传给我.我在阅读时间序列数据库 (TSDB) 时发现了一些开源选项,例如 Atlas、KairosDB、OpenTSDB 等。

我实际上需要 Apache Spark,所以我想知道:我可以在 Apache Spark 上使用时间序列数据库吗?这有什么意义吗?请记住,我对大数据、Apache Spark 的概念以及我在这个问题中谈到的所有问题都非常陌生。

如果我可以在 Spark 上运行 TSDB,我该如何实现?

最佳答案

我是 OpenTSDB 提交者,我知道这是一个老问题,但我想回答。我的建议是将传入数据写入 OpenTSDB,假设您只想存储原始数据并在以后处理它。然后使用 Spark,使用 OpenTSDB 类执行 OpenTSDB 查询。

你也可以用类写数据,我想你想使用 IncomingDataPoint 构造,实际上我现在手头没有细节。如有更多问题,请随时通过 OpenTSDB 邮件列表与我联系。

您可以在此处查看 OpenTSDB 如何处理传入的“put”请求,您应该能够在写入代码中执行相同的操作:

https://github.com/OpenTSDB/opentsdb/blob/master/src/tsd/PutDataPointRpc.java#L42

您可以在此处看到 Splicer 项目提交 OpenTSDB 查询,我认为可以在您的 Spark 项目中使用类似的方法:

https://github.com/turn/splicer/blob/master/src/main/java/com/turn/splicer/tsdbutils/SplicerQueryRunner.java#L87

关于database - 我可以在 Apache Spark 上运行时间序列数据库 (TSDB) 吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32530588/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com