faunadb - 如何在 Fauna DB 上高效查询和过滤？

转载作者：行者123 更新时间：2023-12-02 02:00:21

25

4

例如，假设我们有一个包含数十万份客户文档的集合，其中包含 3 个字段:name、monthly_salary 和 age。

如何查询monthly_salary大于2000，age大于30的文档？

在 SQL 中，这很简单，但对于 Fauna，我很难理解最佳方法，因为索引项仅适用于完全匹配。我在文档中看到我可以使用 Filter 函数，但我需要提前获取所有文档，所以它看起来有点违反直觉而且性能不佳。

下面是我如何实现它的示例，但不确定这是否是最佳方法，尤其是当它包含大量记录时。

Map(
  Filter(
    Paginate(Documents(Collection('clients'))),
    Lambda(
      'client',
      And(
        GT(Select(['data', 'monthly_salary'], Get(Var('client'))), 2000),
        GT(Select(['data', 'age'], Get(Var('client'))), 30),
        )
      )
    ),
    Lambda(
      'filteredClients',
      Get(Var('filteredClients'))
      )
  
  )

这是正确的还是我遗漏了一些关于动物群和 FQL 的基本概念？谁能帮忙？

提前致谢

最佳答案

使用索引执行高效搜索。您可以查看 search with Indexes 的文档, 和 there is a "cookbook"对于一些不同的搜索示例。

有两种使用索引进行搜索的方式，使用哪种方式取决于您搜索的是equality(完全匹配)还是inequality(大于或等于小于，例如)。

寻找平等

如果您需要完全匹配，请使用索引术语。这在文档中是最明确的，这也不是您最初的问题所在，因此我不会在这里过多赘述。但这里有一个简单的例子

给定具有这种形状的用户文档

{
  ref: Ref(Collection("User"), "1234"),
  ts: 16934907826026,
  data: {
    name: "John Doe",
    email: "jdoe@example.com,
    age: 50,
    monthly_salary: 3000
  }
}

和如下定义的索引

CreateIndex({
  name: "users_by_email",
  source: Collection("User"),
  terms: [ { field: ["data", "email"] } ],
  unique: true // user emails are unique
})

您可以搜索与...完全匹配的 Match function !

Get(
  Match(Index("user_by_email"), "jdoe@example.com")
)

寻找不平等

寻找不等式更有趣也更复杂。它需要使用 Index values 和 Range function .

根据上面的文档，我们可以创建一个新的索引

CreateIndex({
  name: "users__sorted_by_monthly_salary",
  source: Collection("User"),
  values: [ 
    { field: ["data", "monthly_salary"] },
    { field: ["ref"] }
  ]
})

请注意，我没有在上面的索引中定义任何术语。对于不等式，重要的还是值。我们还将 ref 作为一个值包含在内，因为我们稍后会需要它。

现在我们可以使用Range 来获取给定范围内的所有用户的薪水。此查询将获取薪水从 2000 开始及以上的所有用户。

Paginate(
  Range(
    Match(Index("users__sorted_by_monthly_salary")),
    [2000],
    []
  )
)

合并索引

对于“或”操作，使用 Union function .对于“AND”操作，使用 Intersection function .

Match 和 Range 等函数返回集合。其中一个非常重要的部分是确保当您将 Set 与 Intersection 等函数“组合”时，数据的形状是相同的。

对于没有值的索引，使用相同形状的集合并不困难，它们默认为相同的单个引用值。

Paginate(
  Intersection(
    Match(Index("user_by_age"), 50), // type is Set<Ref>
    Match(Index("user_by_monthly_salary, 3000) // type is Set<Ref>
  )
)

当 Set 具有不同的形状时，它们需要修改，否则 Intersection 将永远不会返回结果

Paginate(
  Intersection(
    Range(
      Match(Index("users__sorted_by_age")),
      [30],
      []
    ), // type is Set<[age, Ref]>
    Range(
      Match(Index("users__sorted_by_monthly_salary")),
      [2000],
      []
    ) // type is Set<[salary, Ref]>
  )
)

{
  data: [] // Intersection is empty
}

那么我们如何改变 Set 的形状使它们相交呢？我们可以使用 Join function , 以及 Singleton function .

Join 将对 Set 中的所有条目运行操作。我们将使用它来仅返回一个引用。

Join(
  Range(Match(Index("users__sorted_by_age")), [30], []),
  Lambda(["age", "ref"], Singleton(Var("ref")))
)

总而言之:

Paginate(
  Intersection(
    Join(
      Range(Match(Index("users__sorted_by_age")), [30], []),
      Lambda(["age", "ref"], Singleton(Var("ref")))
    ),
    Join(
      Range(Match(Index("users__sorted_by_monthly_salary")), [2000], []),
      Lambda(["age", "ref"], Singleton(Var("ref")))
    )
  )
)

合并索引的技巧

当提供不同的术语时，您可以使用额外的逻辑来组合不同的索引，或者使用绑定(bind)搜索缺失的字段。您可以做很多很酷的事情。

请查看 cook book和 Fauna forums以及想法。

但是为什么!!!

这是个好问题!

考虑一下:由于 Fauna 是作为无服务器 API 提供的，因此您需要为文档和索引上的每个单独读取和写入以及执行查询的计算时间付费。 SQL 可以简单得多，但它是一种高级得多的语言。 SQL 的背后是一个查询规划器，它对如何获取数据做出假设。如果它不能有效地执行此操作，它可能会默认扫描您的整个数据表或以其他方式执行比您预期的成本高得多的操作。

有了 Fauna，您就是查询规划师。这意味着开始要复杂得多，但这也意味着您可以很好地控制数据库的性能，从而控制成本。

我们正在努力改进定义架构和您需要的索引的体验，但目前您必须在低级别定义这些查询。

关于faunadb - 如何在 Fauna DB 上高效查询和过滤？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/69065039/

25

4

0

文章推荐： python - 将 2 列数据框转换为多级分层数据框

python - 我应该将产品图像存储为 db.ListProperty(db.Blob) 还是 db.ListProperty(db.Key)？
我当前正在存储给定产品的上传图像，如下所示: class Product(db.Model): images= db.ListProperty(db.Blob) # More prop
ruby-on-rails - 更快地编写此 rake 命令的方法 - rake db :drop db:create db:migrate db:seed
每次对架构或新迁移文件进行更改时，我都会运行以下命令: rake db:drop db:create db:migrate db:seed 是否有预先构建的等效方法来执行此操作？我从我读到的内容中想
Android Room 数据库文件为空 - .db、.db-shm、.db-wal
在 android 中使用房间作为数据库。当我试图在 sqlviewer 中查看数据时，在数据库文件中找不到表Myapp.db 文件为空。数据/data/packageName/databases/M
ruby-on-rails - 在每个场景之前在 cucumber 中运行 exec 'rake db:drop db:create db:migrate db:seed'
我搜索并尝试了很多次，但没有找到我的答案。我有一些用小 cucumber (在 Rails 项目中)编写的项目的功能文件。所有步骤都已定义，如果我单独启动它们，功能本身运行得很好。我可以将所有场景与我
ruby-on-rails - db :test:clone, db :test:clone_structure, db :test:load, 和 db :test:prepare? 有什么区别
您必须承认，对于 Rails 和数据库的新手来说，rubyonrails.org 上的官方解释使所有这四个任务听起来完全一样。引用: rake db:test:clone Recreate the
ruby-on-rails - 在Heroku Cedar堆栈上运行rake db:drop db:create db:migrate
当我尝试运行时: heroku run rake db:drop db:create db:migrate 我得到错误: Running rake db:drop attached to termin
ruby-on-rails - rake db :migrate db:reset and db:schema:load之间的区别
rake db:migrate 和 rake db:reset 之间的区别对我来说非常清楚。我不明白的是 rake db:schema:load 与前两者有何不同。只是为了确保我在同一页面上: ra
azure - 从 Azure 函数将对象列表保存到 cosmos DB(文档 DB 或 mongo DB)
我们都知道，我们可以使用 Azure 函数(使用 out 参数或使用 return)在 cosmos DB 中一次保存一个文档，例如: object outputDocument = new { i
php - mysql-db 请求 : how to get the db-name and the db-type as output of the request
我有一个包含 60 多个表的 mysql 数据库。这是在我将 joomla 版本 2.5.3 从本地灯移植到网络服务器时构建的。我运行 mysql-db: 移植后我发现我无法登录 amdin 区域。
c# - 如何使用 EF DB First 将 SQL DB 迁移到 Azure SQL DB
我想轻松地将现有数据库迁移到 Azure 托管。在我的项目中，我使用 Entity Framework DB First。有什么经验教训或例子可以说明如何做到这一点吗？最佳答案您本地使用什么数据库
ios - 核心数据 WAL 模式不会持久化对 .db 的更改，只有 .db-wal 和 .db-shm
所以，我一直在使用 MagicalRecord 开发 iPad 应用程序，最近在转移到自动迁移商店后我遇到了一些问题。我需要将我的 .db 文件从一个设备同步到另一个设备，所以我需要所有数据都在 .d
ruby-on-rails - database.yml 文件配置和 postgres - rake db :drop db:create db:migrate
自从我在 Heroku 上部署并希望与生产相匹配后，我最近切换到 postgres 来开发一个 Rails 应用程序。当我将数据库名称设置为“postgres”时，我的应用程序安装了 Postgres
sql-server - 使用 Microsoft OLE DB 提供程序和 SQL Native OLE DB 提供程序建立 DB 连接
我使用 oledb 提供程序(SQLOLEDB 和 SQL Native OLEDB 提供程序)创建了一个示例应用程序。案例 1:提供者 = SQLOLEDB hr = ::CoInitialize
node.js - db.collection.insert 与 db.collection.insertOne 和 db.collection.insertMany 的性能影响
我正在为 NodeJs 使用 mongodb 驱动程序，其中有 3 个方法: 1) db.collection.insert 2) 数据库.collection.insertOne 3) db.col
clojure - db.part/db 的所有字段是什么意思？
我是 datomic 的新手，我仍在努力弄清楚系统是如何构建的。特别是，我不明白 :db.part/db 扮演什么角色，因为每次安装架构时似乎都需要它。有人可以解释一下这一切意味着什么吗？ (需要 '
berkeley-db - Berkeley DB 中的空间索引
Berkeley DB 是否有空间索引，例如 R-tree？最佳答案有人问the same question on the Oracle forum .还没有甲骨文回答。但答案是否定的，它没有任何
php - $db = new DB() 混淆
请解释一下这是什么意思 $db = new DB(DB_DRIVER, DB_HOSTNAME, DB_USERNAME, DB_PASSWORD, DB_DATABASE); 它给了我一个错误 "E
berkeley-db - berkeley-db-je 的最新版本是什么？
berkeley-db-je 的最新版本是什么？来自 oracle , 为 7.5。但来自maven存储库，它是 18.3.12。有没有人知道更多的细节？最佳答案 Berkeley DB Ja
codeigniter - $this->db->replace() 的区别 $this->db->update()
我不明白查询构建器的替换和更新之间的区别。尤其是替换文档... This method executes a REPLACE statement, which is basically the SQL
berkeley-db - Berkeley DB 是开源的吗？我在哪里可以找到它的源代码？
看起来 BerkeleyDB 被 Oracle 收购了，它没有在其网站上发布源代码？最佳答案 Sleepycat 于 2006 年被 Oracle 收购。该产品继续在原始开源许可下可用，并继续得到增

首页

博学

6Ren·AI