nosql - 使用 HBase 和/或 Cassandra 进行搜索(和一般查询)(最佳实践？)-6ren

nosql - 使用 HBase 和/或 Cassandra 进行搜索(和一般查询)(最佳实践？)

转载作者：可可西里更新时间：2023-11-01 14:45:07

25

4

我有一个 User 模型对象，其中只有很少的字段(属性，如果你愿意的话)。说出“名字”、“姓氏”、“城市”和“出生年份”。每个用户还获得“唯一 ID”。

我希望能够通过它们进行搜索。我该如何正确地做到这一点？到底该怎么做？

我的理解(几乎适用于任何键值存储——先是键，然后是值)

u:123456789 = serialized_json_object

(“u”作为用户 key 的简单前缀，123456789 是“唯一 ID”)。

现在，考虑到我希望能够按名字和姓氏进行搜索，我可以保存在:

f:Steve = u:384734807,u:2398248764,u:23276263f:Alex = u:12324355,u:121324334

所以关键是“f”——这是名字的前缀，而“Steve”是实际的名字。对于“u:Steve”，我们将所有属于“Steve”的用户 ID 保存为值。

这使得每次搜索都非常非常容易。通过几个字段(属性)查询——比如通过名字(即“Steve”)和姓氏(即“l:Anything”)仍然很容易——首先从“f:Steve”获取用户 ID 列表，然后从“l”获取用户 ID 列表:Anything”，查找交叉用户 ID，然后就可以了。

问题(而且有很多):

保存、更新、删除用户是一件痛苦的事情。它必须是原子的和一致的操作。此外，如果我们将值(value)的大小限制在某个值(value)之内——那么我们就有(潜在的)麻烦了。这里真的没有答案。只压缩用户 ID 列表？不过也不太酷。
我们要添加新字段以进行搜索的 ID。最终。以“城”说。我们当然可以用同样的方式 "c:Los Angeles"= ..., "c:Chicago"= ...，但是如果我们没有从一开始就预见到所有这些“搜索选择”，那么我们将有能够根据所有现有用户记录创建一些夜类工作或其他工作，并为他们更新那些“c:CITY”……这是一项艰巨的工作!
锁定问题。用户“u:123”更新他的名字“Alex”，用户“u:456”更新他的名字“Alex”。他们都必须用他们的 id 更新“f:Alex”。这意味着要么我们遇到覆盖问题，要么一个更新将等待另一个更新(如果有很多更新则进行成像？!)。

最好的方法是什么？请记住，我想按多个字段进行搜索？

附言拜托，问题是关于 HBase/Cassandra/NoSQL/Key-Value 存储。请拜托——没有使用 MySQL 和“阅读”SELECTs 的建议；并担心“以后”的扩展问题。我完全按照我的方式问我的问题是有原因的。 :-)

最佳答案

能够直接查询属性是您在远离 SQL 时失去的功能之一，因此您需要一种方法来维护自己的索引以让您查找记录。

如果您的数据存储没有内置索引或原子列表操作，您将需要处理您提到的锁定问题。但是，索引不一定需要同步 - 维护一个更新记录队列以重新编制索引，并且您有 3 的解决方案可以重复用于解决 2。

如果特定值的索引列表变得太大，系统无法在单个列表中处理，您可以用列表列表替换用户列表。但是，如果您有那么多具有相同值的记录，它可能不是一个特别有用的搜索条件。

在某些情况下，另一个有用的选项是使用单独的系统进行索引 - 例如，您可以设置 lucene 来索引主数据存储中的记录。

关于nosql - 使用 HBase 和/或 Cassandra 进行搜索(和一般查询)(最佳实践？)，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/2619744/

25

4

0

文章推荐： html - CSS + flex + 高度 100%

文章推荐： c++ - 具有 Windows 7 外观的消息框

nosql - 适用于中小型应用程序的非关系数据库(NoSQL)
在大规模数据集(Google，Facebook，linkedin)中使用非关系数据库(例如键值对存储)的好处显而易见。您认为中小型应用程序如何从使用非关系数据库中受益？最佳答案自60年代以来，IB
nosql - NoSQL 中的多对多关系
我正在努力弄清楚如何最好地为我的系统实现这一点……现在让我的头离开 RDBMS 空间…… 我当前数据库的一部分有三个表:Show、ShowEntry 和 Entry。 ShowEntry 基本上是 S
nosql - nosql 数据库是否适合在线货币交易管理
我计划使用 nosql 数据库作为我的 Web 产品的后端。我有几个非常基本的疑问。 1) 我在博客中读到 Nosql 数据库对于在线货币交易不太好，即数据完整性是最重要的。(我的产品有在线货币交易)
nosql - 为什么我们要使用 NoSQL？
关闭。这个问题是opinion-based .它目前不接受答案。想改善这个问题吗？更新问题，以便可以通过 editing this post 用事实和引文回答问题. 去年关闭。 Improve th
NoSQL 用例场景或何时使用 NoSQL
关闭。这个问题是opinion-based 。目前不接受答案。想要改进这个问题吗？更新问题，以便 editing this post 可以用事实和引文来回答它。 . 已关闭 9 年前。 Improv
nosql - NoSQL 数据库之间的差异
NoSQL 术语有 4 个类别。键\值存储面向文档图面向列。从我的角度来看，所有这些数据建模都有相同的定义，有什么区别？ Key\value 数据库以类似 OOP 中的对象的结构维护数据。访
nosql - 倒排索引的最佳 NoSQL
我正在做一个小项目，我需要构建一个倒排索引并应用基于用户查询的相似性算法 - 基本信息检索。构建和搜索倒排索引的最佳 NoSQL 产品是什么？谢谢，J 最佳答案由于倒排索引是关于存储单词与其在文档
nosql - 你有哪些在线资源来学习 NoSQL？
关闭。这个问题是opinion-based .它目前不接受答案。想改进这个问题？更新问题，以便 editing this post 可以用事实和引用来回答它. 8年前关闭。 Improve this
nosql - 最能描述 NoSQL 数据库的图表是什么？
当使用SQL数据库时，有不同的方式来显示系统的流程。在银行中，您可以使用 ER 来显示其属性。并为其操作使用类图 UML。有什么更好的方法可以为最终用户表示 NoSQL 数据库，如果有任何图表我可以
nosql - 哪些 NoSQL 数据库在数据级别强制执行参照完整性？
关系数据库使用键来完成，并且发生在 (a 非常令人放心的 ) 数据级别。文档数据库必须在应用程序级别强制执行。 RDB 确实强制执行参照完整性。如果两个人之间的关系，如果一个人被删除，关系将自动不复存
nosql - 与 NoSQL 数据库建立关系的有效方法
我目前正在尝试实现类似 Tumblr 的用户交互，例如转发、关注、关注者、评论、我当前关注的人的博客文章等。还需要显示每篇博客文章的事件。我坚持为数据库创建适当的架构。有几种方法可以实现这种功能(
nosql - NoSql (RavenDB) 的多对多设计
我一直在对 Nosql(尤其是 RavenDB)进行一些研究，但我仍然不确定处理以下问题的最佳方法: 我有两个简单的对象，“用户”和“事件”。一个用户可以输入多个事件，一个事件可以由多个用户输入——标
nosql - 在哪里可以找到有关 NOSQL 实现模式的信息？
刚刚看到这篇关于 NOSQL 模式的文章(不是我的)。从开发人员的角度来看，它涵盖了许多 NOSQL 实现模式(如散列和复制模式)。总而言之，如果有人问自己这个问题，它非常有用: Where can
nosql - NoSql 键/值数据库用于什么
我现在在网上听到了很多关于 nosql 键/值数据库的信息。你能举个例子说明一个是做什么用的。什么样的真实世界数据最适合这类数据库？最佳答案我认为'What the heck are you ac
nosql - 何时使用 NoSql，使用哪一种？
就目前而言，这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持，但这个问题可能会引起辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开，visit the he
nosql - 最适合内容推荐的 NoSQL 数据库
我目前正在从事一个项目，其中包括出于性能原因将内容推荐器从 MySQL 迁移到 NoSQL 数据库。我们的团队一直在评估一些替代方案，例如 MongoDB、CouchDB、HBase 和 Cassan
nosql - 如何处理 NoSQL 中重复数据的变化
我们正在为即将到来的项目评估 NoSQL。我倾向于以 RDBMS 的方式思考问题，并且在概念化缺乏规范化方面遇到了困难。我知道在 NoSQL 中复制数据不被认为是错误的。我无法理解的是修复数据更改以
nosql - 为什么键值对 noSQL 数据库比传统关系数据库更快
有人建议我研究键/值对数据系统来替换我一直在使用的关系数据库。我不太了解的是这如何提高查询效率。据我了解，您将丢弃大量有助于提高查询效率的信息，只需将您的结构数据库变成一个长长的键和值列表？我完全
nosql - 如何在 NoSQL 中跟踪记录关系？
我正在尝试找出 NoSQL KVP 或文档数据库中外键和索引的等效项。由于没有数据透视表(用于添加标记两个对象之间关系的键)，我真的很困惑如何以对普通网页有用的方式检索数据。假设我有一个用户，该用户
nosql - 给 NoSQL 初学者的建议
我打算开始学习 NoSQL。我是从《Professional NoSQL》这本书开始的。书中有使用 CouchDB、Cassandra、MongoDB 等的示例。我的疑问是我应该安装所有不同的风格来完

首页

博学

6Ren·AI

商城

nosql - 使用 HBase 和/或 Cassandra 进行搜索(和一般查询)(最佳实践？)