- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我们将cassandra用于基于IOT的应用程序。目前,我们每天都在接收10 GB数据。我们以时间序列模型的方式将所有数据存储到Cassandra中的单个表中。将数据保存在单个表或多个表(年,月)中的最佳方法是什么?
模式:
CREATE TABLE SensorData (
cid text,
event_date date,
event_time timestamp,
data text,
device_id text,
device_type text,
rawdata text,
PRIMARY KEY ((cid, event_date), event_time)
) WITH CLUSTERING ORDER BY (event_time DESC)
最佳答案
据我所知,您似乎还可以关于模式。
如果将来您可能会收到毫秒级的消息
您可能想要划分的级别甚至比一天中的级别还要低
你现在有。
但是日子可能还可以因为传感器很少
在不到几秒钟的时间内发送数据。我什至在一个项目上工作
我们按月分区,数据以秒为单位
这没什么大不了的。因此,从模式看齐
好。
模式似乎也涵盖了Spark作业。
可以,因为您一天可以获取所有数据而无需
太多麻烦了
我会避免应用过滤,特别是如果您每天有10 GB
随着时间的流逝只会变得更糟。如果您提供一些详细信息
关于为什么需要过滤的问题,我可能会帮忙。我的诚实建议是
避免所有这一切。
这需要您遍历日期分区。我猜
我最好的建议就是每天简单地回到历史。和
您需要一个聪明的终止条件。固定所有
客户(例如,不要过去超过x个月)。要么
您可以使其变得更智能,即当您进入客户的“所有”历史记录时
假设10天的桶都空了,您就停下来了。但这可能
棘手的是某些客户的停机时间更长。无论如何,你应该
这是可配置的。
这可能是一个很好的答案,但是如果您已经在使用spark
应该不是问题。
使用cassandra最好先准备好数据。所以你
模式可以正常工作1和2,你很好。 3也可以,但4是
总是有点棘手。通过设计是否每天将10 GB添加到集合中
而您想处理所有这些,则每个过程都将花费越来越长的时间
天。如果您需要所有数据,实际上没有什么可以做的。
通常在这种情况下,您会进行某种已经
假设您需要特定时间单位的总和和平均信息。
也就是说,如果您的报告是一整天的报告,那么您可以在cassandra中输入新内容
那天并存储结果。这样,您就不必重新处理它
每次都再次。因此,您的问题不是多个较小的表,而是
设计ETL操作的方式。
对于备份,我建议使用常规的cassandra工作流程。您提供了什么
在链接中工作正常。从来没有任何问题。我也写了
一些将内容导出到csv中的工具,但更多用于其他客户端
以及想要对我们拥有的数据进行自己处理的公司。
其他问题后更新答案:
问题1:如何每天获取每月都会被截断的数据
CREATE TABLE SensorData(
cid text,
event_date date,
event_time timestamp,
data text,
device_id text,
device_type text,
rawdata text,
PRIMARY KEY ((cid, event_date), event_time, device_id, device_type)
) WITH CLUSTERING ORDER BY (event_time DESC)
CREATE TABLE SensorData_YYYYMM (
cid text,
event_date text,
event_time timestamp,
data text,
device_id text,
device_type text,
rawdata text, PRIMARY KEY ((cid, event_date), event_time, device_id, device_type)
) WITH CLUSTERING ORDER BY (event_time DESC)
((cid, device_id, event_date) event_time, device_type
timeuuid
类型用于event_time。是的,这需要更多
device_id
可能会成为问题
device_id
的列表。每次你
device_id
cid
和
event_date
隔离所需的分区。你应该
关于cassandra - Nosql模式设计/备份策略,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43452010/
如何启用 Mercurial(中央/主)存储库的自动(增量)备份? 我来自颠覆,在那里我能够制作一个提交 Hook ,将更改上传到 S3。 编辑: 如果这种策略对 Mercurial 没有意义,那么什
我想定期创建我的github存储库的备份。是否有一种快速的方法可以在不知道整个列表的情况下将它们全部拉出? 沃尔特 最佳答案 您可以通过GitHub的API获取整个列表: curl http://gi
我正在使用 flatpages在我在本地服务器上开发的站点中。我需要备份平面页面的数据以在最终服务器中使用它。有谁知道怎么做? 最佳答案 在您的本地服务器上运行: python manage.py d
我们已将应用服务升级到 S1,并希望设置自动备份。这是一个带有 SQL 数据库的 .net core 应用程序。对于数据库部分,我得到以下内容: No supported connection str
我们使用一些 阻止 blob 来存储一些持久资源,然后 用于存储事件数据的页面 blob 我们需要备份 blob,因此我尝试使用 AzCopy。它在我的开发机器上工作正常,但在其他慢速机器上失败,并出
关闭。这个问题需要更多 focused .它目前不接受答案。 想改进这个问题?更新问题,使其仅关注一个问题 editing this post . 5年前关闭。 Improve this questi
我正在看这个例子 docker run --rm --volumes-from myredis -v $(pwd)/backup:/backup debian cp /data/dump.rdb /b
我们使用一些 阻止 blob 来存储一些持久资源,然后 用于存储事件数据的页面 blob 我们需要备份 blob,因此我尝试使用 AzCopy。它在我的开发机器上工作正常,但在其他慢速机器上失败,并出
我目前正在使用 Java,并且正在寻找一个程序,该程序可以在每次编译时保存我正在执行的操作的新版本。我不介意它是否不运行,我可以进去编辑类名,使其与 .java 名称匹配。由于我是一个初学者,我总是因
在 RabbitMQ 管理控制台中,出于导入和导出目的,我在概览页面底部看到了导入/导出定义链接。但是有了这个,我能够导出整套队列、交换等。 我有一个 MQ 服务器,其中包含多个应用程序的 MQ 设置
我在 Eclipse IDE 中做了一个 Maven 项目,但在某些时候,我决定以其他名称复制并粘贴工作区位置中的文件夹,以避免在迄今为止工作正常的原始项目中进行一些错误配置,但是,我在执行中遇到了问
有没有办法备份在任何给定元素上设置的所有事件? 背景故事:我有一些代码,当用户将鼠标悬停在某个图标上时(想想悬停帮助文本),会显示绝对定位的“弹出窗口”。如果用户将鼠标悬停在弹出窗口上,它会停留在周围
我需要将 MySQL 数据库移动到新位置。根据workbench,数据库大小只有200MB,但有些表有数百万行,报告索引和数GB的数据长度。结果,EXPORT 的大小为 15GB,导出 DB 并将其复
我有一个工作数据库 - 我想复制它的所有数据(甚至只是其中的 1 个表)并在磁盘上创建备份,并在另一个位置(不是同一台计算机)上创建一个“备份”数据库。另一台计算机未连接到互联网 我该怎么做? 最佳答
我有一个实时数据库,我想要做的是制作一份副本。我可以通过 SSH 和 phpMyAdmin 访问 MySQl。是否有一个命令可以在单个命令/操作中复制/备份数据库,而无需使用导出/导入? 谢谢 最佳答
我是 PostgreSQL 的新手,我正在寻找备份数据库的方法。我知道有 3 种方法 pg_dump,快照和复制以及使用 WAL。您建议使用哪一个来完整备份数据库?如果可能,请提供代码片段。 最佳答案
如何快速备份/恢复mysql数据库中的数据? 最佳答案 mysqldump命令行备份最快, (使用mysql命令行恢复,mysql -u #username# -p #database# < #dum
从管理的角度来看,我是 MySQL 的新手。 在过去的几个小时里,我一直在谷歌上搜索,但没有成功,我想知道是否有人可以为我指明正确的方向,让我知道要用谷歌搜索什么或提出建议。 基本上,我正在寻找有关如
我需要备份创建模式附带的数据库(转储)。使用 putty(通过 SSH)完成这项工作的命令行是什么?我研究并思考了这个命令,但它只执行表备份和数据。 mysqldump -h HOST -u LOGI
我正在尝试创建一个将整个/dev/sda1 备份到/mnt/Backup 的 bash 脚本 /dev/sda1 457G 3.5G 431G 1% / /dev/sdb1
我是一名优秀的程序员,十分优秀!