google-cloud-firestore - 用于大型文档和内部数组的争用友好型数据库架构-6ren

google-cloud-firestore - 用于大型文档和内部数组的争用友好型数据库架构

转载作者：行者123 更新时间：2023-12-03 19:12:23

25

4

语境

我有一个包含使用此架构的文档集合的数据库(缩短架构，因为某些数据与我的问题无关):

{
    title: string;
    order: number;
    ...
    ...
    ...
    modificationsHistory: HistoryEntry[];
    items: ListRow[];
    finalItems: ListRow[];
    ...
    ...
    ...
}

这些文档很容易达到 100 或 200 kB，具体取决于它们持有的项目和最终项目的数量。以尽可能少的带宽使用尽可能快地更新它们也非常重要。

这是在 Web 应用程序上下文中，使用 Angular 9 和 @angular/fire 6.0.0。

问题

当最终用户编辑对象的 item 中的一项时数组，就像只编辑一个属性，反射(reflect)在数据库里面需要我发送整个对象，因为firestore的 update方法不支持字段路径内的数组索引，唯一可以对数组进行的操作是添加或删除元素 as described inside documentation .

但是，更新 items 的一个元素通过发送整个文档来创建数组会给没有良好连接的任何人带来糟糕的性能，我的许多用户都是这种情况。

第二个问题是，在我的情况下，将所有内容实时保存在一个文档中会使协作变得困难，因为其中一些元素可以由多个用户同时编辑，这会产生两个问题:

如果在同一秒内进行两次更新，则某些写入操作可能会因文档争用过多而失败。

更新不是原子性的，因为我们一次发送整个文档，因为它不使用事务来避免更多地使用带宽。

我已经尝试过的解决方案

子集

描述

这是一个非常简单的解决方案:为 items 创建一个子集合, finalItems和 modificationsHistory数组，使它们易于编辑，因为它们现在拥有自己的 ID，因此很容易联系到它们来更新它们。

为什么它不起作用

有一个包含 10 finalItems 的列表, 30 items和 50 个条目 modificationsHistory意味着我需要总共打开 4 个监听器才能完全监听一个元素。考虑到用户可以同时打开许多这样的元素，有几十个文档被收听会产生同样糟糕的性能情况，在完整的用户案例中可能更糟。

这也意味着，如果我想用 100 个项目更新一个大元素，并且我想更新其中的一半，那么每个项目将花费我一次写入操作，更不用说检查权限所需的读取操作量等，每次写入可能 3 次，所以 150 次读取 + 50 次写入只是为了更新数组中的 50 个项目。

用于更新文档的云功能

const {
  applyPatch
} = require('fast-json-patch');

function applyOffsets(data, entries) {
  entries.forEach(customEntry => {
    const explodedPath = customEntry.path.split('/');
    explodedPath.shift();
    let pointer = data;
    for (let fragment of explodedPath.slice(0, -1)) {
      pointer = pointer[fragment];
    }
    pointer[explodedPath[explodedPath.length - 1]] += customEntry.offset;
  });
  return data;
}

exports.updateList = functions.runWith(runtimeOpts).https.onCall((data, context) => {
  const listRef = firestore.collection('lists').doc(data.uid);
  return firestore.runTransaction(transaction => {
    return transaction.get(listRef).then(listDoc => {
      const list = listDoc.data();
      try {
        const [standard, custom] = JSON.parse(data.diff).reduce((acc, entry) => {
          if (entry.custom) {
            acc[1].push(entry);
          } else {
            acc[0].push(entry);
          }
          return acc;
        }, [
          [],
          []
        ]);
        applyPatch(list, standard);
        applyOffsets(list, custom);
        transaction.set(listRef, list);
      } catch (e) {
        console.log(data.diff);
      }
    });
  });
});

描述

使用 diff 库，我在以前的文档和新更新的文档之间进行了比较，并将此差异发送到使用事务 API 操作更新的 GCF。

这种方法的好处是，由于事务发生在 GCF 内部，因此速度非常快并且不会消耗太多带宽，而且更新只需要发送一个差异，而不是整个文档。

为什么它不起作用

实际上，云功能真的很慢，有些更新需要 2 秒以上才能完成，它们也可能由于争用而失败，而 Firestore 连接器不知道它，因此在这种情况下无法确保数据完整性。

如果我找到其他要尝试的东西，我将相应地进行编辑以添加更多解决方案

题

我觉得我错过了一些东西，比如如果 firestore 有一些我根本不知道的东西可以解决我的用例，但我无法弄清楚它是什么，也许我以前测试过的解决方案实现得很糟糕，或者我错过了重要的事情。我错过了什么？甚至有可能实现我想做的事情吗？我对数据重构、查询更改等任何事情都持开放态度，因为它主要用于学习目的。

最佳答案

通过使用 Maps 而不是 Arrays 来存储数据，您应该能够减少更新文档所需的带宽。这将允许您仅发送使用其 key 更新的项目。
我不知道这对你来说改变会有多大影响，但这听起来比其他选项少。
您说您的文档单个达到200kb并非不可能。最好记住 Firestore 将文档大小限制为 1mb。如果您计划除此之外的支持文档，您将需要找到一种方法来分割数据。
关于您的争用问题... 您可能会考虑使用“锁定”文档并防止它在其他用户尝试保存时接收更新的系统。您可以使用使用 websockets 或 Firebase FCM 构建的简单消息系统来执行此操作。客户端将订阅文档的 channel ，并在他们尝试更新时发布。其他客户端随后会收到文档正在更新的通知，并且必须等待才能保存自己的更改。
另外，我不知道 modifyHistory 的内容是什么样的，但在我看来，这听起来像是您可能会保留在子集合中的数据类型。
在您尝试过的解决方案中，子集合对我来说似乎是最具可扩展性的。您可以研究不使用 onSnapshot 监听器的可能性，而是创建自己的事件系统来通知客户端更改。我想它可以像我上面提到的“锁定”系统一样工作。客户端在更新属于文档的项目时发送事件。订阅该文档 channel 的其他客户端将知道检查数据库以获取最新版本。

关于google-cloud-firestore - 用于大型文档和内部数组的争用友好型数据库架构，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/61660933/

25

4

0

文章推荐： reactjs - 如何在 withFormik() 形式中使用 useMutation 钩子(Hook)

文章推荐： constraints - GEKKO - 矩阵形式的优化

文章推荐：来自 YAML 文件的 Jenkins 管道

文章推荐： git - 如何在本地仓库中构建/测试代码，同时继续修改它

MSBuild:为主项目生成 XML 文档，但不为依赖项目生成 XML 文档
我有一个 .sln 文件，里面有几个项目。为了简单起见，让我们称它们为... 项目A 项目B 项目C ...其中 A 是引用 B 和 C 的主要项目。我的目标是更新我的构建脚本，为 ProjectA
api - 如何生成 Magento 的 API 文档/文档？
我安装了 Magento，我想知道如何生成完整的 API 文档，例如 http://docs.magentocommerce.com/ 上的文档是使用 phpdoc 生成的。 Magento 中是否包
java - 创建自定义 jsdocs、java 文档、php 文档
我通常使用jetbrains family ide。在为函数创建文档时非常有用，只需输入 /** 如何在创建文档时创建自定义标签，例如@date标签。最佳答案 JavaScript、Java: st
java - 无法打开使用 jOpenDocument 创建的 ODS 文档 Google 文档
我正在尝试使用 jOpenDocument library创建文档。我已经执行了创建电子表格的示例 - 代码编译并运行正常，但当我尝试使用 Excel Office 2012 或 Google Doc
javascript - HTML DOM 从哪里开始？ window ？文档？文档.defaultView？
如标题。有没有介绍HTML DOM构造的图片？最佳答案 DOM(文档对象模型)从文档节点开始。它被称为“根节点”。观察下面的树(括号中对应的nodeType): [HTMLDocument]
ide - 如何更改 ColdFusion 帮助以显示 ColdFusion 8 文档，而不是 ColdFusion 9 文档？
我喜欢 ColdFusion Builder。但我不喜欢帮助只有 CF9 文档。有什么方法可以将其更改为拥有 ColdFusion 8 文档？最佳答案 http://livedocs.adobe.c
javascript - jQuery 脚本 : function(window, 文档，未定义)与 ;(函数($，窗口，文档，未定义)
这个问题在这里已经有了答案: What is the consequence of this bit of javascript? (4 个答案) 关闭 9 年前。我看到一些 jQuery 脚本嵌
c# - 使用 XML 文件中的数据生成 Word 文档 (docx)/基于模板将 XML 转换为 Word 文档
我有一个 XML 文件，其中包含需要在 Word 文档中填充的数据。我需要找到一种方法来定义一个模板，该模板可用作从 XML 文件填充数据并创建输出文档的基线。我相信有两种方法可以做到这一点。创
AVAudioEngine 文档
我正在尝试查找有关如何使用 AVAudioEngine 的详细文档。有谁知道我在哪里可以找到它？我找到了这个，但与文档丰富的 UI 内容相比，它似乎非常简陋。 https://developer.a
tensorflow 文档
我对 Tensorflow 文档越来越感到恼火和沮丧。我在谷歌上搜索了有关的文档 tf.reshape 我被定向到一个通用页面，例如 here 。我想查看 tf.reshape 的详细信息，而不是整
Clojure:文档
我正在学习本教程:http://moxleystratton.com/clojure/clojure-tutorial-for-the-non-lisp-programmer 然后遇到了这个片段: u
Swagger 文档
如何在 swagger 中为对象数组编写文档。这是我的代码，但我不知道如何访问对象数组中的数据。 { "first_name":"Sam", "last_name":"Smith",
Javascript 文档
是否有针对 Javascript 的 JavaDocs 之类的东西？当我在 netbeans IDE 中按 ctrl+space 时写javascript，指定对象的javascript文档就出来了
jquery 文档
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题，以便用事实和引用来回答。关闭 5 年前。
Javascript 文档
我需要 JavaScript 中的 heredoc 之类的东西。你对此有什么想法吗？我需要跨浏览器功能。我发现了这个: heredoc = '\ \ \ zzz\ \
03、WSDL 文档
WSDL 文档是包含一系列的，可描述某个 web service 的定义的，简单的 XML 文档 WSDL 文档结构 WSDL 文档用下表这些主要的元素来描述某个 web service 的
lua - OCRopus 文档？
是否有 ocropus 的文档？我正在寻找对以下功能的解释: make_SegmentPageByRAST(): segment() RegionExtractor(): setPageLines(
关于如何添加事件处理程序的 C# 文档
这个问题在这里已经有了答案: Understanding events and event handlers in C# (13 个回答) 4年前关闭。我正在使用 NRECO 和 ffmpeg 对视
Javascript 文档.domain
我正在尝试访问工作服务器以与名为 Spotfire 的应用程序一起使用。我的同事把这个传给我，现在已经休息了几个星期，我对他的建议有意见。实际上，当我通过 localhost 运行我的 Web 应用
Elm 文档 - "a"是什么意思？
Elm 文档没有给出示例用法，因此很难理解类型规范的含义。在几个地方，我看到“a”用作参数标识符，例如 Platform.Cmd : map : (a -> msg) -> Cmd a -> Cmd

首页

博学

6Ren·AI

商城

google-cloud-firestore - 用于大型文档和内部数组的争用友好型数据库架构