mysql - 大容量静态分析数据的最佳存储引擎-6ren

mysql - 大容量静态分析数据的最佳存储引擎

转载作者：行者123 更新时间：2023-11-30 23:40:31

28

4

我正在构建一个需要存储和查询大量时间戳数据的应用程序。具体来说，这是一种分析类型的数据，其中一个特定的“集合”可以包含多达 100 个通过共享时间戳连接在一起的独立数据点。此数据是静态的，因为它一旦存储就永远不会改变，但在从数据库中删除之前可能会被多次查询(我们目前只存储 12 周的数据)。

目前，我们将此数据存储在 MySQL 中，其中包含多个表，每个表大约有 1 亿行(我们每天添加大约 300 万行)。这在仅按时间戳存储和查询数据时很好，但在执行带排序的 SELECT 时，尤其是在尝试从表中删除旧的陈旧数据时，这会变得乏味。使用例如 WHERE 时间戳 < $12weeksago 的 DELETE 查询通常需要几个小时才能完成。

我们还想保留 12 周之后的一些数据，这会在针对另一列的 DELETE 中添加另一个 WHERE 子句。这进一步减慢了速度。

考虑到大量的读/写和查询需求，您会根据这个用例推荐什么存储引擎？

最佳答案

这完全取决于您所做的选择类型。如果 NoSQL 数据库可以做到这一点，那么这可能是您最好的猜测。

但是，我认为您可以通过对数据库进行分区来大大提高性能。由于它已经是基于时间的，因此您可以轻松地每天/每周/每月创建一个分区，这样您只需查询与当前查询相关的表。而删除旧数据是简单的drop table而不是慢速删除。

关于mysql - 大容量静态分析数据的最佳存储引擎，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/3543756/

28

4

0

文章推荐： mysql - 通过包含 jQuery 的 Img Src 变量更新 MySQL 值

文章推荐： python - 在Python中将日期转换为自然语言？

文章推荐： python - 从 mongoengine 中的嵌入文档中删除值

ios - WebSQL - 容量
我在 iOS 上有一个使用 WebSQL 数据库的 PhoneGap 应用程序。在某些地方，我读到存储容量是 5MB，而在其他地方，我读到它是 50MB，有人可以帮我解决这个问题吗？我还计划在数据库中
kubernetes - 更新节点 pod 容量
我想弄清楚如何更新节点的 pod 容量。我使用文档中概述的 Vagrant/VM 环境进行了简单的集群设置。我尝试使用 kubectl 修补节点的 pod 容量，执行以下操作: 通过以下方式发送补丁所
r - 如何检查 RAM 容量
我想创建一个函数，根据某人系统上的可用 RAM 大小来导入不同批处理的数据。但是如何找到 R 中的可用 RAM 量呢？我可以使用 memory.size() 但这只适用于 Windows。最佳答案
azure - Power BI 容量
目前，我正在努力将 Power BI 内容嵌入到我的 Web 应用程序中。我已经通过服务主体实现了它，并且它按预期工作。但是对于产品环境，是否必须为我的报告或工作区添加容量？是否可以在不增加生产环境容
kubernetes pv/pvc 容量
我有一个 3 节点 coros kubernetes 集群启动并运行。我想使用来自独立 NFS 服务器的 persitentvolumes(pv)。 nfs.yaml apiVersion: v1
go - 范围使用是否需要 channel 容量？
我正在学习golang一段时间。我遇到了 channel 问题。我有两个例子。它们看起来一样，但是其中1个给出了错误。当我分配 channel 容量(转换为缓冲 channel )时，问题已解决，
c - 通过指针的字符串(数组)容量
我正在尝试创建一个子例程，将一个字符串插入另一个字符串。我想检查主机字符串是否有足够的容量来容纳所有字符，如果没有，则返回错误整数。这需要使用类似 sizeof 的东西，但可以使用指针调用。我的代码如
c++ - 调整大小后的 vector 容量
这个问题在这里已经有了答案: size vs capacity of a vector? (8 个答案) 关闭 7 年前。在下面的程序中，我只是创建了一个空 vector ，然后将大小调整为 5
c++ - 增加 vector 容量
免责声明 1 - 我是编程新手免责声明 2 - 我搜索了又搜索，但找不到我正在寻找的帮助。对于一个项目，我或多或少地以更精简的形式重写了 vector 类。我挂断的部分是编写 push_back 方
java - 了解 BTree 容量
我对 BTree 的理解是: if root BTree size is 32, the level 1 have 1024 keys capacity the level 2 can sort 10
android - ActionBar 容量/溢出不会随方向变化而变化
我有一个使用 ActionBar 的应用程序，我自己处理方向更改: android:configChanges="keyboard|keyboardHidden|orientation|screenS
hadoop - 如何增加 hdfs 容量
如何将 hadoop DFS 的配置容量从默认的 50GB 增加到 100GB？我目前的设置是在 centOS6 机器上运行的 hadoop 1.2.1，使用了 450GB 中的 120GB。已使用
go - 减少 slice 容量
我的问题是关于 slice 长度和容量。我在这里学习 Go:https://tour.golang.org/moretypes/11 . (我的问题被标记为可能与 this 重复；但是，事实并非如此。
arrays - slice - 容量/长度？
现在尝试从教程中学习 Go，并且有一个非常基本的问题: func main() { a := make([]int, 5) // [0,0,0,0,0] len=5 cap=5 b :=
oracle - 如何从单个查询中获取所有表空间名称、分配大小、可用大小、容量？
如何以以下格式获取有关数据库中所有表空间的信息。 TABLESPACE_NAME | FILE_NAME | ALLOCATED_MB | FREE_MB | CAPACITY | 有没有办法自
hadoop - 为特定的M/R作业设置 reducer 容量
我想基于每个作业更改群集的减少插槽容量。也就是说，最初，我为Tasktracker配置了8个reduce插槽，因此对于具有100个reduce任务的作业，将同时运行(8 * datanode数量)r
Hadoop:指定 HDFS 的最大大小/容量
我正在运行单节点 Hadoop 部署。我知道我的应用程序需要多少数据，我可以设置(和重新设置)HDFS 使用的最大容量吗？我已经尝试了以下方法，但似乎无法实现。检查 hdfs-site.xml 和
hadoop - Splunk:HDFS 容量 N/A
我安装了 splunk 来监控和分析 hadoop 作业。我在其他节点的Jobtracker、forwarder和TA中安装splunk core和splunk hadoop app后，HDFS ca
c++ - 复制后的 std::vector 容量
vector::operator= 会改变 vector 容量吗？如果有，怎么做？ vector的拷贝构造函数是否拷贝容量？我查看了文档，但找不到具体答案。是否依赖于实现？最佳答案您可以保证:
azure - 导出 SQL 数据库和 DTU 容量
将 SQL 数据库导出到存储时，我们的 DTU 容量已达到，这本质上意味着我们的系统性能受到严重影响。这对我们来说是一个问题，因为我们使用导出功能来备份和移动数据库。这个问题有解决办法吗？最佳答

首页

博学

6Ren·AI

商城

mysql - 大容量静态分析数据的最佳存储引擎