- android - RelativeLayout 背景可绘制重叠内容
- android - 如何链接 cpufeatures lib 以获取 native android 库?
- java - OnItemClickListener 不起作用,但 OnLongItemClickListener 在自定义 ListView 中起作用
- java - Android 文件转字符串
在大多数教程中,标签将存储为 [tag, tag, tag]。我有另一个想法,像这样保存标签:“tag.tag.tag”,例如“web.javascript.angularJS”,然后像这样查询文档
db.articles.find({'tags': /javascript/})
我认为查找子字符串比数组中的元素更快。有没有人有类似的经历。
最佳答案
MongoDB 中的数据建模是通过首先确定您需要回答的问题并从这些问题中得出优化的数据模型来完成的。就您而言,您的问题似乎是
For a given tag, what are the articles?
为了尽快回答您的查询,您需要为它们建立索引。索引基本上是用户定义的键的键值存储以及数据文件中的文档位置。
如果您将标签写在单个字符串中,我们将看看索引会是什么样子。假设我们有三个文档,每个文档都有三个标签,其中两个带有规范化标签“javascript”。简化了很多(实际上,索引存储在 B-trees 中),我们的索引将如下所示:
"foo.bar.baz": LocationOfDocument1;
"foo.javascript.bar": LocationOfDocument2;
"bar.javascript.baz": LocationOfDocument3;
如您所见,我们在关键方面有很多冗余。这有两个问题。第一个问题是,即使找到了标签,索引仍可能提供额外的命中,因此我们的查询花费的时间比最佳时间长。第二个问题是冗余占用了宝贵的 RAM。假设您有数十万甚至数百万篇文章。
那么,如果我们使用数组来存储标签,我们的索引会是什么样子呢?
"foo":[ LocationOfDocument1, LocationOfDocument2 ];
"bar":[ LocationOfDocument2, LocationOfDocument2, LocationOfDocument3 ];
"baz":[ LocationOfDocument1, LocationOfDocument3 ];
"javascript":[ LocationOfDocument2, LocationOfDocument3 ];
还是多余的,对吧?好吧,除了一些因素:我们已经大大减少了 key 端的大小,并且与相当昂贵的长字符串作为 B-树。(附注:我认为文档位置存储为 4 字节整数。)所以我们的索引可能有更多的条目,但它更紧凑。
此外,我们还有一个额外的优势:我们可以放弃相当昂贵的正则表达式。换句话说:您可以通过使用简单的等式表达式来消除对索引键使用正则表达式来查找搜索字符串的成本。在 shell 术语中,这看起来像:
db.articles.insert({"foo":bar,tags:[tag1.toLowerCase(), tag2.toLowerCase()]})
…
db.articles.find({"tags":inputStr.toLowerCase()})
通过将索引存储在 B 树中,您的搜索时间会大大减少。还有另一个优点。由于 B 树是排序的,当我们找到正匹配时,例如在“javascript”上,我们将拥有带有这些标签的所有 文档,并且索引处理可以停止。通过对键进行正则表达式搜索,每次都必须处理索引的所有键,而且操作成本也相当高。
通过将标签存储在数组中,您将加快给定标签的平均查找时间,并且肯定不会比缩减为相当长的字符串的标签索引差。此外,您需要更少的 RAM 来存储索引,这在缩放时非常重要。
预期评论:是的,这也是数据和经验所显示的。
注意我对提出以下建议犹豫不决(因为这可能弊大于利),但在某些用例中 text search index可能有道理。例如,当您想要对文章的标签、标题和文本进行不区分大小写的搜索“JavaScript”时。但是,使用文本索引会带来一些超出此答案范围的复杂性。而且,您仍然可以将标签放在一个数组中。
关于javascript - mongodb存储标签,应该使用联合字符串还是数组?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34304129/
我有一个 html 格式的表单: 我需要得到 JavaScript在value input 字段执行,但只能通过表单的 submit .原因是页面是一个模板所以我不控制它(不能有
我管理的论坛是托管软件,因此我无法访问源代码,我只能向页面添加 JavaScript 来实现我需要完成的任务。 我正在尝试用超链接替换所有页面上某些文本关键字的第一个实例。我还根据国家/地区代码对这些
我正在使用 JS 打开新页面并将 HTML 代码写入其中,但是当我尝试使用 document.write() 在新页面中编写 JS 时功能不起作用。显然,一旦看到 ,主 JS 就会关闭。用于即将打开的
提问不是为了解决问题,提问是为了更好地理解系统 专家!我知道每当你将 javascript 代码输入 javascript 引擎时,它会立即由 javascript 引擎执行。由于没有看过Engi
我在一个文件夹中有两个 javascript 文件。我想将一个变量的 javascript 文件传递到另一个。我应该使用什么程序? 最佳答案 window.postMessage用于跨文档消息。使
我有一个练习,我需要输入两个输入并检查它们是否都等于一个。 如果是 console.log 正则 console.log false 我试过这样的事情: function isPositive(fir
我正在做一个Web应用程序,计划允许其他网站(客户端)在其页面上嵌入以下javascript: 我的网络应用程序位于 http://example.org 。 我不能假设客户端网站的页面有 JQue
目前我正在使用三个外部 JS 文件。 我喜欢将所有三个 JS 文件合而为一。 尽一切可能。我创建 aio.js 并在 aio.js 中 src="https://code.jquery.com/
我有例如像这样的数组: var myArray = []; var item1 = { start: '08:00', end: '09:30' } var item2 = {
所以我正在制作一个 Chrome 扩展,它使用我制作的一些 TamperMonkey 脚本。我想要一个“主”javascript 文件,您可以在其中包含并执行其他脚本。我很擅长使用以下行将其他 jav
我有 A、B html 和 A、B javascript 文件。 并且,如何将 A JavaScript 中使用的全局变量直接移动到 B JavaScript 中? 示例 JavaScript) va
我需要将以下整个代码放入名为 activate.js 的 JavaScript 中。你能告诉我怎么做吗? var int = new int({ seconds: 30, mark
我已经为我的 .net Web 应用程序创建了母版页 EXAMPLE1.Master。他们的 I 将值存储在 JavaScript 变量中。我想在另一个 JS 文件中检索该变量。 示例1.大师:-
是否有任何库可以用来转换这样的代码: function () { var a = 1; } 像这样的代码: function () { var a = 1; } 在我的浏览器中。因为我在 Gi
我收到语法缺失 ) 错误 $(document).ready(function changeText() { var p = document.getElementById('bidp
我正在制作进度条。它有一个标签。我想调整某个脚本完成的标签。在找到可能的解决方案的一些答案后,我想出了以下脚本。第一个启动并按预期工作。然而,第二个却没有。它出什么问题了?代码如下: HTML:
这里有一个很简单的问题,我简单的头脑无法回答:为什么我在外部库中加载时,下面的匿名和onload函数没有运行?我错过了一些非常非常基本的东西。 Library.js 只有一行:console.log(
我知道 javascript 是一种客户端语言,但如果实际代码中嵌入的 javascript 代码以某种方式与在控制台上运行的代码不同,我会尝试找到答案。让我用一个例子来解释它: 我想创建一个像 Mi
我如何将这个内联 javascript 更改为 Unobtrusive JavaScript? 谢谢! 感谢您的回答,但它不起作用。我的代码是: PHP js文件 document.getElem
我正在寻找将简单的 JavaScript 对象“转储”到动态生成的 JavaScript 源代码中的最优雅的方法。 目的:假设我们有 node.js 服务器生成 HTML。我们在服务器端有一个对象x。
我是一名优秀的程序员,十分优秀!