java - 低延迟读写的持久化策略-6ren

java - 低延迟读写的持久化策略

转载作者：搜寻专家更新时间：2023-11-01 03:14:45

25

4

我正在构建一个应用程序，其中包含一个或多或少以交互方式批量标记数百万条记录的功能。用户交互与 Gmail 非常相似，用户可以在其中标记单个电子邮件或批量标记大量电子邮件。我还需要快速读取这些标签成员资格，以及读取模式或多或少是随机的。

现在我们正在使用 Mysql 并为每个标签文档对插入一行。将数百万行写入 Mysql 需要一段时间(高 I/O)，即使使用批量插入和大量优化也是如此。我们需要这是一个交互式过程，而不是批处理过程。

对于我们正在存储和读取的数据，数据的一致性和可用性不如性能和可扩展性重要。因此，如果在写入过程中发生系统故障，我可以处理一些数据丢失。但是，数据肯定需要在某个时候持久化到辅助存储。

所以，总而言之，这里是要求:

可能有数千万条记录的低延迟批量写入
数据需要以某种方式持久化
低延迟随机读取
不需要持久写入
最终一致性没问题

以下是我看过的一些解决方案:

写入缓存(Terracotta、Gigaspaces、Coherence)，其中记录被异步写入内存并排空到数据库。这些让我有点害怕，因为它们似乎增加了我想要避免的应用程序的一定复杂性。
高度可扩展的键值存储，例如 MongoDB、HBase、Tokyo Tyrant

最佳答案

如果您有为此使用 Coherence 的预算，我强烈建议您这样做。在 Coherence 中直接支持后写、最终一致性行为，并且它在数据库中断和 Coherence 集群节点中断时都非常容易恢复(如果您在单独的 JVM 上使用 >= 3 个 Coherence 节点，最好在单独的主机上)。我已经为一家财富 100 强公司的电子商务网站实现了此方法来执行大容量 CRM，并且效果非常好。

此架构的最佳方面之一是，您编写 Java 应用程序代码时就好像没有发生任何后写行为，然后插入使其发生的 Coherence 拓扑和配置。如果您以后需要更改 Coherence 的行为或拓扑，则无需更改您的应用程序。我知道可能有一些合理的方法可以做到这一点，但这种行为在 Coherence 中得到直接支持，而不是必须发明或手动实现一种方法。

要提出一个非常好的观点 - 您对增加应用程序复杂性的担心是一个好主意。使用 Coherence，您只需将更新写入缓存(或者如果您使用的是 Hibernate，它可以是 L2 缓存提供程序)。根据您的 Coherence 配置和拓扑，您可以选择部署您的应用程序以使用后写式、分布式缓存。因此，由于缓存的特性，您的应用程序不再复杂(坦率地说，您并不知道)。

最后，我在 2005-2007 年实现了上述解决方案，当时 Tangosol 制作了 Coherence，他们得到了最好的支持。我不确定 Oracle 现在的情况如何 - 希望仍然很好。

关于java - 低延迟读写的持久化策略，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/1764426/

25

4

0

文章推荐： Java制作一个阅读器的副本

文章推荐： Java Midlet 部署

持久/保存实体时，HIbernate覆盖数据
我是Hibernate的新手。当我保存特定实体时，它将从现有实体中重写数据。我将ID用作自动生成，如下所示: @Id @GeneratedValue(strategy=GenerationType.
dart - 持久/连续连接的HttpClient行为
我正在尝试以连续模式使用CouchDB更改通知API，所以我想发送此消息 _changes？feed = continuous？include_docs = true作为GET请求到达我的CouchD
XMPP 持久 session 室状态
我有 XMPP 服务器(openfire)和一堆客户端(spark)，分为几个组(部门)。我正在寻找能够将它们留在 session 室中的能力。我的意思是 Skype 具有的类似功能；当用户关闭带有群
Azure(持久)函数 - 管理并行性
我发布这个问题是为了看看我是否正确理解 Azure Functions 中的并行性，特别是 Durable Functions。最近使用 az cli 在 Azure Functions 中添加了设
azure - 持久 AKS 容器的日志
我在 Dev Env 上有一个 AKS 集群，上面运行着一些容器。我还启用了 Azure Log Analytics。但我可以看到正在运行的当前容器的日志，而不是已被终止或停止的旧容器的日志。我想知
queue - 持久 Akka 邮箱和无损
在 Akka 中，当一个 actor 在处理消息时死亡(在 onReceive(...) { ... } 内)，该消息就会丢失。有没有办法保证无损？有一种配置 Akka 在将消息发送到 onRecei
haskell - selectOneMany Yesod 持久
我试图让 selectOneMany 取得有限的成功。我有以下数据库模型 User email Text verkey Text Maybe verified Bool password T
haskell - 使用按键列表进行选择持久 (Yesod)
我需要使用持久性(Yesod)从键列表中获取实体列表假设我有一个 Model 及其相应的 ModelId。我身边有: keys :: [ModelId] 我需要得到 models :: [Model
java - GWT 持久 URL
我有一个使用 GWT、请求工厂和地点/Activity 构建的网络应用程序。我很好奇我使用的历史 token 是否持久。该任务基本上就是让 URL 定义我的网络应用程序的确切位置(读作“文件/文件夹结
jquery - 如何刷新页面并保持元素不刷新(持久)直到用户单击提交？
我正在寻找一种 jQuery 方法来在刷新页面时使页面元素持久保留在用户屏幕上。当我刷新页面并且丢失 jQuery 页面中的内容时，它会发生变化。我需要页面持久。如何刷新页面并保持元素不刷新(持久)
c - OpenMP 无效控制谓词 - 持久
当我尝试使用 gcc 编译带有 -fopenmp 标志的 C 代码时，我已经持续收到此错误超过 6 小时了。错误:控制谓词无效 for ( int i = 0; i #include #ifde
java - 如何隔离实体验证以防止整个批量(持久)事务的事务回滚？
我有带有验证注释的实体，例如@NotNull。我不知道如何防止容器管理的事务在批量持久操作中出现 ConstraintViolationException 的情况下回滚，例如: public void
javascript - 持久 header 导致网站高度崩溃
这是我的代码: http://jsfiddle.net/KCb5z/8/embedded/result/ http://jsfiddle.net/KCb5z/8/ $(function () {
java - 持久 I/O 流连接
我正在与服务器通信，理想情况下，我希望输入流和输出流始终处于运行状态。我收到未经请求的响应，因此我必须始终准备好接收输入流上的数据。在我进一步深入之前，我应该说我建立的任何连接都必须能够支持 SSL
Azure Functions - TCP 持久
我正在寻找一种正确扩展 Azure Functions 的方法，但遇到了问题。我有一组 IoT 设备，通过 HTTP 向 Azure 发送数据(为此，有一组自动扩展的 Azure Functions
浅谈Hibernate中的三种数据状态(临时、持久、游离)
1.临时态（瞬时态）不存在于session中，也不存在于数据库中的数据，被称为临时态。比如：刚刚使用new关键字创建出的对象。 2.持久态存在于session中，事务还未提交，提交之后
php - Kohana 持久 session 和子域
我在 Kohana v2 中使用数据库 session 驱动程序。为了使 session 持久化，Kohana 创建了一个 token cookie。这个 cookie 使用了我想的 cookie 配
python - PyWinrm 持久 PowerShell session
有谁知道是否有办法使用 PyWinrm 打开一个持久的 PowerShell session ，该 session 保持状态并且可以多次调用？我正在尝试执行以下操作: #!/bin/python im
elasticsearch - 如何在不重启集群的情况下(持久)更新Elasticsearch中的index.number_of_replicas设置？
在运行的Elasticsearch集群中，配置文件中的index.number_of_replicas设置为1。我可以通过运行以下命令在运行的集群上将其更新为2 # curl -XPUT "http
java - Spring + Hibernate - 持久/提交数据不起作用
我在“这么长的帖子必须意味着大量的代码和配置”部分下一对一地使用指南代码。 http://blog.springsource.com/2006/08/07/using-jpa-in-spring-wi

首页

博学

6Ren·AI

商城

java - 低延迟读写的持久化策略