- Java 双重比较
- java - 比较器与 Apache BeanComparator
- Objective-C 完成 block 导致额外的方法调用?
- database - RESTful URI 是否应该公开数据库主键?
我正在构建一个应用程序,其中包含一个或多或少以交互方式批量标记数百万条记录的功能。用户交互与 Gmail 非常相似,用户可以在其中标记单个电子邮件或批量标记大量电子邮件。我还需要快速读取这些标签成员资格,以及读取模式或多或少是随机的。
现在我们正在使用 Mysql 并为每个标签文档对插入一行。将数百万行写入 Mysql 需要一段时间(高 I/O),即使使用批量插入和大量优化也是如此。我们需要这是一个交互式过程,而不是批处理过程。
对于我们正在存储和读取的数据,数据的一致性和可用性不如性能和可扩展性重要。因此,如果在写入过程中发生系统故障,我可以处理一些数据丢失。但是,数据肯定需要在某个时候持久化到辅助存储。
所以,总而言之,这里是要求:
以下是我看过的一些解决方案:
最佳答案
如果您有为此使用 Coherence 的预算,我强烈建议您这样做。在 Coherence 中直接支持后写、最终一致性行为,并且它在数据库中断和 Coherence 集群节点中断时都非常容易恢复(如果您在单独的 JVM 上使用 >= 3 个 Coherence 节点,最好在单独的主机上)。我已经为一家财富 100 强公司的电子商务网站实现了此方法来执行大容量 CRM,并且效果非常好。
此架构的最佳方面之一是,您编写 Java 应用程序代码时就好像没有发生任何后写行为,然后插入使其发生的 Coherence 拓扑和配置。如果您以后需要更改 Coherence 的行为或拓扑,则无需更改您的应用程序。我知道可能有一些合理的方法可以做到这一点,但这种行为在 Coherence 中得到直接支持,而不是必须发明或手动实现一种方法。
要提出一个非常好的观点 - 您对增加应用程序复杂性的担心是一个好主意。使用 Coherence,您只需将更新写入缓存(或者如果您使用的是 Hibernate,它可以是 L2 缓存提供程序)。根据您的 Coherence 配置和拓扑,您可以选择部署您的应用程序以使用后写式、分布式缓存。因此,由于缓存的特性,您的应用程序不再复杂(坦率地说,您并不知道)。
最后,我在 2005-2007 年实现了上述解决方案,当时 Tangosol 制作了 Coherence,他们得到了最好的支持。我不确定 Oracle 现在的情况如何 - 希望仍然很好。
关于java - 低延迟读写的持久化策略,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1764426/
我是Hibernate的新手。当我保存特定实体时,它将从现有实体中重写数据。 我将ID用作自动生成,如下所示: @Id @GeneratedValue(strategy=GenerationType.
我正在尝试以连续模式使用CouchDB更改通知API,所以我想发送此消息 _changes?feed = continuous?include_docs = true作为GET请求到达我的CouchD
我有 XMPP 服务器(openfire)和一堆客户端(spark),分为几个组(部门)。我正在寻找能够将它们留在 session 室中的能力。我的意思是 Skype 具有的类似功能;当用户关闭带有群
我发布这个问题是为了看看我是否正确理解 Azure Functions 中的并行性,特别是 Durable Functions。 最近使用 az cli 在 Azure Functions 中添加了设
我在 Dev Env 上有一个 AKS 集群,上面运行着一些容器。我还启用了 Azure Log Analytics。但我可以看到正在运行的当前容器的日志,而不是已被终止或停止的旧容器的日志。 我想知
在 Akka 中,当一个 actor 在处理消息时死亡(在 onReceive(...) { ... } 内),该消息就会丢失。有没有办法保证无损?有一种配置 Akka 在将消息发送到 onRecei
我试图让 selectOneMany 取得有限的成功。 我有以下数据库模型 User email Text verkey Text Maybe verified Bool password T
我需要使用持久性(Yesod)从键列表中获取实体列表 假设我有一个 Model 及其相应的 ModelId。我身边有: keys :: [ModelId] 我需要得到 models :: [Model
我有一个使用 GWT、请求工厂和地点/Activity 构建的网络应用程序。我很好奇我使用的历史 token 是否持久。该任务基本上就是让 URL 定义我的网络应用程序的确切位置(读作“文件/文件夹结
我正在寻找一种 jQuery 方法来在刷新页面时使页面元素持久保留在用户屏幕上。当我刷新页面并且丢失 jQuery 页面中的内容时,它会发生变化。 我需要页面持久。如何刷新页面并保持元素不刷新(持久)
当我尝试使用 gcc 编译带有 -fopenmp 标志的 C 代码时,我已经持续收到此错误超过 6 小时了。 错误:控制谓词无效 for ( int i = 0; i #include #ifde
我有带有验证注释的实体,例如@NotNull。我不知道如何防止容器管理的事务在批量持久操作中出现 ConstraintViolationException 的情况下回滚,例如: public void
这是我的代码: http://jsfiddle.net/KCb5z/8/embedded/result/ http://jsfiddle.net/KCb5z/8/ $(function () {
我正在与服务器通信,理想情况下,我希望输入流和输出流始终处于运行状态。我收到未经请求的响应,因此我必须始终准备好接收输入流上的数据。 在我进一步深入之前,我应该说我建立的任何连接都必须能够支持 SSL
我正在寻找一种正确扩展 Azure Functions 的方法,但遇到了问题。 我有一组 IoT 设备,通过 HTTP 向 Azure 发送数据(为此,有一组自动扩展的 Azure Functions
1.临时态(瞬时态) 不存在于session中,也不存在于数据库中的数据,被称为临时态。 比如:刚刚使用new关键字创建出的对象。 2.持久态 存在于session中,事务还未提交,提交之后
我在 Kohana v2 中使用数据库 session 驱动程序。为了使 session 持久化,Kohana 创建了一个 token cookie。这个 cookie 使用了我想的 cookie 配
有谁知道是否有办法使用 PyWinrm 打开一个持久的 PowerShell session ,该 session 保持状态并且可以多次调用?我正在尝试执行以下操作: #!/bin/python im
在运行的Elasticsearch集群中,配置文件中的index.number_of_replicas设置为1。 我可以通过运行以下命令在运行的集群上将其更新为2 # curl -XPUT "http
我在“这么长的帖子必须意味着大量的代码和配置”部分下一对一地使用指南代码。 http://blog.springsource.com/2006/08/07/using-jpa-in-spring-wi
我是一名优秀的程序员,十分优秀!