- mongodb - 在 MongoDB mapreduce 中,如何展平值对象?
- javascript - 对象传播与 Object.assign
- html - 输入类型 ="submit"Vs 按钮标签它们可以互换吗?
- sql - 使用 MongoDB 而不是 MS SQL Server 的优缺点
我阅读了大量 Azure 表/Blob/SQL 存储之间的比较,我认为我对所有这些都有很好的理解......但是,我仍然不确定我的特定需求应该去哪里。也许有人在类似情况下有经验并且能够提出建议。
我有什么
一个 SQL Azure DB,它将文章以原始 HTML 格式存储在 varchar(max) 列中。每行还有许多元数据列和许多索引,以便于查询。该表包含许多对用户、订阅、标签等的引用 - 因此我的项目将始终需要 SQL DB。
有什么问题
我在这个表中已经有大约 500,000 篇文章,我预计它会以每年数百万篇文章的速度增长。每篇文章的 HTML 内容可以在几 KB 到 1 MB 之间,或者在极少数情况下大于 1 MB。
出现了两个问题:由于 Azure SQL 存储很昂贵,所以我会早晚考虑存储它的成本。此外,我也会更早地达到 150 GB 的数据库大小限制。这 500,000 篇文章现在已经消耗了 1.6 GB 的数据库空间。
我要什么
很明显,这些 HTML 内容必须从 SQL DB 中删除。虽然文章表本身必须保留以将其连接到用户、订阅、标签等,以便快速发现所需文章的关系,但至少可以将保存 HTML 内容的列外包给更便宜的存储。
乍一看,Azure 表存储似乎非常适合
以非常便宜的价格和快速查询在一个大表中存储 TB 的数据 - 拥有一个单独的表存储表作为 SQL DB 的附加组件保存文章内容,这听起来很完美。
但是阅读此处的比较表明它甚至可能不是一个选项:每列 64 KB 足以容纳我 98% 的文章,但还有 2% 的空间对于某些单篇文章,甚至整个 1 MB 的行限制都可能不够。
Blob 存储听起来完全错误,但是...
因此,Azure 上只剩下一个选项:Blob。现在,它可能不像听起来那么错误。在大多数情况下,我一次只需要一篇文章的内容。对于 Blob 存储,这应该可以正常工作且足够快。
但是我也有一些查询,我需要一次包含 50、100 甚至更多行,甚至包括内容。所以我必须运行 SQL 查询来获取所需的文章,然后从 Blob 存储中获取每篇文章。我没有这方面的经验,但我无法相信在执行此操作时我能够保持查询的毫秒时间跨度。对于我的项目来说,需要几秒钟的查询是绝对不行的。
所以它似乎也不是一个合适的解决方案。
我看起来像个有计划的人吗?
至少我有类似计划的东西。我只考虑将适当的记录“导出”到 SQL 表存储和/或 Blob 存储中。
类似于“只要内容小于 64 KB,就将其导出到表存储,否则将其保留在 SQL 表中(甚至将此单个 XL 记录导出到 BLOB 存储中)”
这可能足够好。但它使事情变得复杂,并且可能会导致不必要的错误。
其他选项
还有一些其他的 NoSQL DB,如 MongoDB 和 CouchDB,它们似乎更适合我的需求(至少从我作为一个只阅读纸上规范的人的幼稚观点来看,我没有使用它们的经验)。但是他们需要自托管,如果可能的话,我想摆脱它。我在 Azure 上尽可能少地做自托管服务器和服务方面的工作。
你真的读到这里了吗?
那么非常感谢您抽出宝贵的时间和思考我的问题:)
任何建议将不胜感激。如您所见,我有自己的想法和计划,但没有什么比以前走在路上的人的经验更胜一筹了:)
谢谢,
伯恩哈德
最佳答案
我注册只是为了帮助解决这个问题。过去,我从 Stackoverflow 找到了对我的问题有用的答案 - 谢谢社区 - 所以我认为尝试用这个问题来回馈是公平的(也许公平是轻描淡写),因为它落在我的胡同里.
简而言之,在考虑问题中陈述的所有因素的同时,表存储可能是最佳选择 - 如果您可以正确估计每月的交易量:a nice article on this .
您可以通过拆分(纯文本方法或序列化)文档/html/data 来解决您提到的两个限制,行和列限制。从表存储中存储 40 GB+ 数据的经验来看,我们的应用程序经常以毫秒为单位在每次页面访问中检索超过 10 行 - 这里没有参数!如果您有时需要 50 多行,您正在查看低个位数秒,或者您可以并行执行(并进一步通过将数据拆分到不同分区中)或以某种异步方式执行。或者,阅读下面建议的多级缓存。
再详细一点。我尝试使用 SQL Azure、Blob(页面和块)和表存储。我不能代表 Mongo DB,因为部分原因是这里已经提到的,我不想走那条路。
YourBlobClientWithReferenceToTheFile.Seek(TableStorageData.start, SeekOrigin.Begin);
int numBytesToRead = (int)TableStorageData.end - (int)TableStorageData.start;
int numBytesRead = 0;
while (numBytesToRead > 0)
{
int n = YourBlobClientWithReferenceToTheFile.Read(bytes,numBytesRead,numBytesToRead);
if (n == 0)
break;
numBytesRead += n;
numBytesToRead -= n;
}
关于mongodb - 从 SQL Azure 中获取大行 - 但去哪里?表、Blob 或 MongoDB 之类的东西?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16714984/
这个fn是吗: function isplainobj ( obj ) { return Object.prototype.toString.call( obj ) === "[object
我尝试创建一个我没有经验的小 bash 脚本。我尝试做类似的事情: #!/bin/bash statut="na" if [ $proc = 0 ]; then statut = "close
我想重写 HighLine 的几个方法来自定义我的控制台,目前我的代码如下所示: cmd = ask("#{@prompt_label} #{@prompt_separator} ",
鉴于下面的 HTML,我尝试使用 jQuery 来匹配所有具有类“foo”的跨度的列表项,并且该跨度应包含文本“relevant”。 Some text relevant Some more
我拥有一个 5 美元 20GB SSD Digital Ocean Droplet,它几乎用完了 Docker 镜像和容器的空间。 有没有办法购买一个卷,将其连接到服务器并安全地将所有 Docker
我有这样的表: id name number result stuff stuff stuff stuff 我只想将 class = "red" 添加到
我需要计算两点之间的距离,但不是以常规方式。我需要知道“东西距离”+“南北距离”。我想这比常规的“乌鸦飞翔”计算更简单,但我仍然不知道如何做到这一点。 我想使用 MySQL 查询来执行此操作,并且最好
#include #include #include typedef struct dict_pair { void *key; void *value; struct dict_p
为什么当我尝试通过 将 char[] word 写入控制台时会发生这种奇怪的事情 Console.WriteLine(word); 我得到了一个正确的结果,但是当我写的时候 Console.Write
一个简单的例子: class C{} class B{ @Inject C c; void doSomething(){ System.out.println(c);
我想做某事,但不确定如何描述它。我有这门课 public class Company { private List _persons; private Person GetPersonByNa
我正在尝试实现我自己的 qDebug()样式调试输出流,这基本上是我目前所拥有的: struct debug { #if defined(DEBUG) template std::os
所以我正在为我的应用程序编写一个搜索功能,代码如下: - (void) selectObject: (NSString *)notes{ [axKnotes removeAllObjects]
我想在 Rust 中匹配一种复杂的继承式东西: struct Entity { pub kind: EntityKind, } pub enum EntityKind { Player
我是 SQL 新手。这没有返回任何结果...... SELECT media.id as mediaid, media.title as mediatitle, media.description
在微型 SDCard 上写入 Android things 图像并将该卡插入 Raspberry Pi 3 Model B 并打开电源,启动时显示“Auto config Please wait”然后
这是一个常见的但是文本出现在框的右侧,不是极右但几乎是这样 h3: ................................................ .................
#include #include #include #include #include int main(int argc, string argv[]) { if(argc >
所以我试图让一些东西相互堆叠。首先,查看工作链接会有所帮助,您会看到问题所在: http://brownbox.net.au/clients/matchlessphotography/ 现在我需要使用
我想在禁用 javascript 时在我的网站顶部显示一条消息(就像在 SO 上一样),但在谷歌浏览器上不起作用 最佳答案 看起来是这样。 您可以使用 javascript 隐藏“noscript”消
我是一名优秀的程序员,十分优秀!