- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我不是数据库专家,因此我来这里寻求一点帮助。我有大量测量数据,我想帮助自己处理数据。这是我的情况:大约有 10 个站点,每天测量。每天,一个人会产生大约 3000 行(大约 15 列)的数据。数据必须每天从每个站点下载一次到中央服务器。这意味着每天大约有 30 000 行插入到数据库中。 (每日计数是可变的)
现在,我已经有了过去几年的数据,所以对于每个站,我都有几百万行。还有 cca 20 个“死”站 - 不再工作,但有几年的数据。总而言之,我们将获得大约 50+ 百万行,由 30 个站点生成,每天插入大约 30,000 行。展望 future ,让我们假设数据库中有 1 亿行。
我的问题很明显 - 您建议如何存储这些数据?测量值(列)只是数字(整数或 double + 日期时间)- 没有文本或全文搜索,基本上我需要的唯一索引是 DATETIME。数据不会更新,也不会删除。我只需要快速选择一系列数据(例如,从 1.1.2010 到 3.2.2010)
正如我所写,我想使用 MySQL,因为这是我最了解的数据库。我读过,它应该很容易处理这么多数据,但是,我仍然感谢针对这种情况的任何建议。再次:
据我所知,MySQL应该能处理这么大的数据量。我也知道,我唯一的索引是 DATETIME 类型的日期和时间(应该比其他索引快,对吗?)我无法决定的是,是创建一个包含 50+ 百万行(带有站点 ID)的巨大表,还是分别为每个站点创建表。基本上,我不需要在这些站上执行任何 JOIN。如果我需要做时间重合,我可以选择相同的站时间范围。这些方法有什么缺点/优点吗?
任何人都可以确认/拒绝我的想法吗?您认为有更好的解决方案吗?感谢任何帮助或讨论。
最佳答案
MySQL 应该能够很好地处理这个问题。我建议您创建两个复合索引,而不是仅索引您的 DATETIME
列,如下所示:
(datetime, station)
(station, datetime)
拥有这两个索引将有助于加速选择日期范围和按站点分组的查询,反之亦然。第一个索引也将用于仅索引 datetime
的目的。
您还没有告诉我们您的典型查询是什么。您也没有告诉我们您是否打算淘汰旧数据。您的数据显然是范围分区 (http://dev.mysql.com/doc/refman/5.6/en/partitioning-range.html) 的候选者,但我们需要更多信息来帮助您设计可行的分区标准。
阅读您的评论后编辑。
构建此系统时需要牢记几件事。
首先,暂时不要为分区烦恼。
其次,我会让所有的东西都在一张表上工作。不要按车站或年份拆分内容。给自己买一个你能负担得起的最快的磁盘存储系统,并为你的 MySQL 服务器配备大量 RAM,你应该没问题。
第三,偶尔停下来做OPTIMIZE TABLE
;这将确保您的索引良好。
第四,不要使用SELECT *
,除非您知道您需要表中的所有列。为什么?因为
SELECT datetime, station, temp, dewpoint
FROM table
WHERE datetime >= DATE(NOW() - INTERVAL 60 DAY)
ORDER BY station, datetime
可以直接通过对复合覆盖索引的顺序访问来满足
(station, datetime, temp, dewpoint)
鉴于
SELECT *
FROM table
WHERE datetime >= DATE(NOW() - INTERVAL 60 DAY)
ORDER BY station, datetime
需要随机访问您的表。您应该阅读复合覆盖索引。
第五,避免在 WHERE
子句中使用带有列名的函数。不要说
WHERE YEAR(datetime) >= 2003
或类似的东西。 MySQL 不能为这种查询使用索引。而是说
WHERE datetime >= '2003-01-01'
允许索引被利用。
关于大数据MySQL数据库设计,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24634587/
关闭。这个问题需要更多focused .它目前不接受答案。 想改善这个问题吗?更新问题,使其仅关注一个问题 editing this post . 4年前关闭。 Improve this questi
.NET 框架:4.5.1 我在 Blend for visual studio 2015 中遇到一个奇怪的错误,我找不到它的来源。 如果我在 VS 中打开我的 WPF 解决方案,它会加载并运行良好。
我经常遇到这样的问题,与 Hierarchical RESTful URL design 非常相似 假设该服务仅提供用户上传文档。 POST, GET /accounts PUT, DELETE /a
在 Rails 应用程序中,我使用 devise 来管理我的用户,而我用来销毁 session 的链接不再有效。它正在工作,现在我添加了事件管理员,但没有。 我的链接是 :delete, :clas
我已经坚持了超过 24 小时,试图按照此处发布的其他解决方案进行操作,但我无法使其正常工作。我是 Rails 新手,需要帮助! 我想让我的/users/edit 页面正常工作,以便我可以简单地更改用户
Devise 在以下情况下不会使用户超时: 用户登录,关闭选项卡,然后在超时 + X 分钟内重新访问该 URL。用户仍处于登录状态。 如果选项卡已打开并且稍后刷新/单击,则超时可以正常工作。这意味着
我想使用这样的 slider 我希望该 slider 根据提供给它的值进行相应调整。到目前为止,我只能应用具有渐变效果的背景,但无法获得这种效果。请通过提供样式代码来帮助我。
您应该为每种方法创建一个请求/响应对象,还是应该为每个服务创建一个? 如果我在所有方法中使用它,我的服务请求对象中将只有 5 个不同的东西,因为我对几乎所有方法使用相同的输入。 响应对象将只有一个字典
我正在尝试在 REST 中对实体的附件进行建模。假设一个缺陷实体可以附加多个附件。每个附件都有描述和一些其他属性(上次修改时间、文件大小...)。附件本身是任何格式的文件(jpeg、doc ...)
我有以下表格: Blogs { BlogName } BlogPosts { BlogName, PostTitle } 博客文章同时建模一个实体和一个关系,根据 6nf(根据第三个宣言)这是无效的。
如果 A 类与 B、C 和 D 类中的每一个都有唯一的交互,那么交互的代码应该在 A 中还是在 B、C 和 D 中? 我正在编写一个小游戏,其中许多对象可以与其他对象进行独特的交互。例如,EMP点击
关于如何记住我与 Omniauth 一起工作似乎有些困惑。 根据这个wiki ,您需要在 OmniauthCallbacksController 中包含以下内容: remember_me(user)
设计问题: 使用 非线程安全 组件(集合,API,...)在/带有 多线程成分 ... 例子 : 组件 1 :多线程套接字服务器谁向消息处理程序发送消息... 组件 2 :非线程安全 消息处理程序 谁
我们目前正在设计一个 RESTful 应用程序。我们决定使用 XML 作为我们的基本表示。 我有以下关于在 XML 中设计/建模应用程序数据的问题。 在 XML 中进行数据建模的方法有哪些?从头开始然
我正在设计一个新的 XSD 来从业务合作伙伴那里获取积分信息。对于每笔交易,合作伙伴必须提供至少一种积分类型的积分值。我有以下几点:
设计支持多个版本的 API 的最佳方法是什么。我如何确保即使我的数据架构发生更改(微小更改),我的 api 的使用者也不会受到影响?任何引用架构、指南都非常有用。 最佳答案 Mark Nottingh
关闭。这个问题是opinion-based 。目前不接受答案。 想要改进这个问题吗?更新问题,以便 editing this post 可以用事实和引文来回答它。 . 已关闭 4 年前。 Improv
我想用 php 创建一个网站,其工作方式与 https://www.bitcoins.lc/ 相同。确实,就每个页面上具有相同布局但内容会随着您更改链接/页面而改变而言,我如何在 php 中使用lay
我有一个关于编写 Swing UI 的问题。如果我想制作一个带有某些选项的软件,例如在第一个框架上,我有三个按钮(新建、选项、退出)。 现在,如果用户单击新按钮,我想将框架中的整个内容更改为其他内容。
我正在尝试找出并学习将应用程序拥有的一堆Docker容器移至Kubernetes的模式和最佳实践。诸如Pod设计,服务,部署之类的东西。例如,我可以创建一个其中包含单个Web和应用程序容器的Pod,但
我是一名优秀的程序员,十分优秀!