gpt4 book ai didi

cassandra - 我应该或不应该一起使用Cassandra和Redis来构建可扩展的一对一聊天应用程序?

转载 作者:IT王子 更新时间:2023-10-29 06:02:17 25 4
gpt4 key购买 nike

到目前为止,我几乎已经使用MySQL来完成所有事情,但是我不喜欢手动分片数据并暂时维护所有数据的想法。

我想构建一个像Facebook和WhatsApp的一对一聊天应用程序,如下图所示:

enter image description here

因此,这里有两个部分。右侧部分是聊天线程中的所有消息,左侧部分显示带有来自上一条消息的信息的聊天线程,以及您的聊天伙伴信息,例如名称和图像等。

到目前为止,这就是我所拥有的:

Cassandra确实擅长写作和阅读。但是由于逻辑删除,在删除数据上并没有那么多。而且您不希望将gc_grace_seconds设置为0,因为如果节点关闭并发生删除,则在完成修复后,该删除的行可能会恢复正常。因此,我们可能最终会在节点进入集群之前从节点删除所有数据。无论如何,据我所知,Cassandra对于此聊天应用程序的正确部分将是完美的。由于消息将按其插入时间进行存储和排序,因此排序永远不会改变。因此,您只需读写即可。这是Cassandra擅长的。

我有这些表来存储右侧的消息:

CREATE TYPE user_data_for_message (
from_id INT,
to_id INT,
from_username TEXT,
to_username TEXT,
from_image_name TEXT,
to_image_name TEXT
);

CREATE TABLE message_by_thread_id (
message_id TIMEUUID,
thread_id UUID,
user_data FROZEN <user_data_for_message>,
message TEXT,
created_time INT,
is_viewed BOOLEAN,
PRIMARY KEY (thread_id, message_id)
) WITH CLUSTERING ORDER BY (message_id DESC);

在插入新消息之前,如果客户端未提供thread_id,则可以检查两个用户之间是否存在线程。我可以像这样存储这些信息:
CREATE TABLE message_thread_by_user_ids (
thread_id UUID,
user1_id INT,
user2_id INT,
PRIMARY KEY (user1_id, user2_id)
);

我可以为user1和user2颠倒顺序的每个线程存储两行,因此我只需要读1来检查是否存在。由于我不想在每次插入之前检查线程是否存在,因此我可以首先检查Redis中用户之间是否存在线程,因为它在内存中并且速度更快。

我可以像上面那样在Redis中保存上面的相同信息(不是我在Cassandra中做的两种方式,而是一种保存内存的方式。我们可以做两个GET来检查它):
SET user:1:user:2:message_thread_id 123e4567-e89b-12d3-a456-426655440000

因此,在发送消息之前,我可以先在Redis中检查两个用户之间是否存在线程。如果在Redis中找不到,我可以 checkin Cassandra(以防Redis服务器在某个时候关闭并且没有保存它),并且如果存在线程,只需使用该thread_id插入新消息,否则就创建线程,然后将其插入表中:
message_thread_by_user_ids

使用上面的SET命令将其插入Redis。然后最后将消息插入:
message_by_thread_id

好了,现在是棘手的部分。聊天的左侧部分没有静态的排序顺序。顺序一直在变化。如果对话中有新消息,则该对话将转到顶部。因此,我没有找到一种在不进行删除和插入的情况下在Cassandra中对此建模的好方法。我必须删除一行,然后将其插入,以便表对行进行重新排序。而且,要删除行并在表中插入行,每次发送消息对我来说听起来都不是一个好主意,但是我可能错了,我对Cassandra并不熟悉。

所以我的想法是我可以在左侧使用Redis,但是唯一的问题是,如果Redis服务器宕机,那么左侧的最新聊天对话将丢失,即使聊天本身仍保留在Cassandra中。用户将需要重新发送消息以使对话再次出现。

我以为可以在Redis中做到以下几点:

每次用户发送一条消息,例如,如果用户1向用户2发送消息,我都可以这样做:
ZADD user:1:message_thread_ids 1510624312 123e4567-e89b-12d3-a456-426655440000

ZADD user:2:message_thread_ids 1510624312 123e4567-e89b-12d3-a456-426655440000

排序后的集合将跟踪线程的ID,其中最近 Activity 的 session 按Unix时间戳进行排序。

但是,另一个问题是,每次加载此窗口时,我都必须执行ZRANGE,例如在左侧获取20个最近的对话,然后在Cassandra中使用LIMIT 1执行20个单个SELECT语句以获取有关最后发送的消息,可能不是那么有效。我以为我可以使用HMSET将最近20次最新 Activity 对话中的最后一条消息的信息保存为HMSET,其中包含最相关的信息,例如消息本身仅精简为60个字符,last_message时间戳,from_username,to_username,from_id,to_id,from_image, to_image和message_id。
HMSET thread:123e4567-e89b-12d3-a456-426655440000 <... message info ...>

但是现在我必须跟踪并从Redis中删除不相关的哈希映射,因为我不想保留最新的20个以上的哈希映射,因为它很快就会消耗内存。我将从Redis和内存中获得最新的20,如果用户向下滚动,那么一次将从Cassandra获得10。另一个问题是,如果Redis服务器出现故障,那么如果对话是一个全新的对话,我可能会从应用程序的左侧断开对话。

我认为通过这种方法,仅添加新节点就可以每秒在Cassandra端获得大量写入,而Redis每秒可以完成20万至80万次操作,因此删除和添加到排序集的操作不应一个限制。由于Redis服务器会来回传递一些消息,因此我可以尝试通过管道方式传递Redis命令或编写Lua脚本,这样我就可以一次性将指令发送给Redis。

这是一个好主意吗?如何解决显示 Activity 对话的应用程序左侧问题?像我建议的那样在Redis中执行此操作是个好主意,还是应该以其他方式进行操作?

最佳答案

两者都是很好的解决方案。但是瓶颈可能在哪里?

1)Redis仅限于内存,不能超过内存。同样,当服务器关闭时,您也会丢失数据。

2)在扩展方面,redis使用带分片的主从拓 flutter ,其中Cassandra使用环形拓 flutter ,其中每个节点都等于读写。

在我看来,我宁愿使用Cassandra,也要知道它不如Redis快,但足够快且易于扩展。

Is this a good idea? How can I solve this issue of the left side of the app that shows active conversations? Is it a good idea to do this in Redis like I suggested or should I do it differently?



您的用户如何彼此书写,我想您是通过websocket来执行此操作的,不是吗?如果是,只需跟踪套接字ID并在套接字断开连接时将其删除即可。

另一个问题是,您在哪里以及如何检索某个人的 friend ID(图片的左侧)?

关于cassandra - 我应该或不应该一起使用Cassandra和Redis来构建可扩展的一对一聊天应用程序?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47276519/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com