java - Hibernate OGM 分页滚动-6ren

java - Hibernate OGM 分页滚动

转载作者：行者123 更新时间：2023-12-01 16:46:22

28

4

假设我们有一个巨大的 mongodb 集合(大约 60,000,000 条记录)，并且我们希望滚动它，当然不想获取大量内存。对于 Hibernate orm 来说，这是可能的，因为有滚动 api 和条件查询，但是 OGM 中分页的解决方案是什么(已经花了很多时间，但我找不到东西)？我使用 setFirstResult-setMaxResult Api 批量索引 50,000 个对象。这些是从查询中获取批处理的时间(以秒为单位)，例如

em.createNativeQuery(query, Entity.class).setFirstResult(i).setMaxResults(batchSize).getResultList()
results.stream().forEach(res -> fullTextEntityManager.index(res));

通过在每次迭代中增加 i ，例如 i+=batchSize;

我已经尝试使用 OgmMassIndexer，但我需要能够启动-停止、索引特定范围，所以我更喜欢手动执行。

显而易见且合乎逻辑的是，每次迭代中查找第一个结果的时间正在增加。这里我有时间以秒为单位从400万开始找到下一批50000(setFirstResult(4000000).setMaxResult(50000)):

例如。到 4000000 需要 17 秒等。到 4050000 需要 15 秒等。到 4100000 需要 12 秒等。但后来这个数字增加了很多:

发现:17找到:15找到:12找到:13找到:13找到:13找到:15找到:16找到:16发现: 17找到:18找到:18发现: 19发现: 19找到:20找到:20找到: 21找到: 21找到:22找到: 21找到:22找到:23找到:23找到:23找到: 24找到: 24找到:25找到:25找到: 26找到: 26找到: 27找到: 28找到: 27找到: 29找到: 29找到:30找到: 31找到: 32找到: 33找到:30找到: 33找到: 32找到:34找到:34找到:35找到:35找到: 38找到:36找到: 38找到:36找到: 41找到: 41找到: 39找到: 41找到: 41找到:40找到: 42找到: 43找到: 42找到:44找到:44找到:45找到: 47找到:45找到:44找到:44找到: 47找到:44找到: 47找到: 47找到:50找到: 52找到:93

有没有使用 ogm 游标滚动 mongodb 或其他东西来获取 session 中的对象并有效地索引它们的选项？我的意思是，即使对于想要在不使用 Hibernate Search 的情况下使用 OGM 对大量数据进行分页的应用程序来说，这也是不可行的，所以我想有一个我看不到的解决方案。

非常感谢。

使用 ElasticSearch 的 Hibernate OGM 5.3.1、Hibernate Search 5.9.0

最佳答案

OGM 尚不支持滚动，因为它需要不受支持的 Criteria API。

话虽这么说，您可以以不同的方式实现您的流程。

我假设这个过程变得越来越慢来自查询部分(MongoDB 越来越难找到第 N 个结果)，而不是来自索引部分(Elasticsearch 越来越难将文档添加到索引)。

如果是这种情况，您可以尝试“分块”查询而不是分页。这个想法是首先检索要索引的实体类型的第一个和最后一个 ID，然后不使用分页，而是使用类似于 where ID between <last ID in the previous query + 1> AND <last ID in the previous query + page size> 的条件运行查询。 .

假设 ID 字段在 MongoDB 中具有升序索引，这应该可以避免性能随着时间的推移而变差。

关于java - Hibernate OGM 分页滚动，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/49799883/

28

4

0

文章推荐： java - IntelliJ - 等于之前不必要的 'null' 检查

文章推荐： java - map 中的 map 条目列表

文章推荐： java - 如何在scala中将java列表转换为数组？

文章推荐： java 小数格式无法正确舍入

java - Neo4j-ogm:如何根据环境使用不同的配置(ogm.properties/java配置)？
到目前为止，我一直在我的项目中使用嵌入式 Neo4j 服务器。现在我想使用独立服务器尝试新的 Bolt 协议(protocol)，但仅限于我部署的应用程序。为了方便起见，我仍然想在从 IDE 运行(永
neo4j - 在 Neo4j OGM 1.1.3 ogm depth of 2 中加载对象非常慢
使用 session.load() 查询深度 2 时出现超时.我正在使用 Neo4j OGM 1.1.3(尝试从 Spring Data Neo4j 3.4 迁移)。尝试加载 Node 对象 clas
java.lang.NoSuchMethodError : org. neo4j.ogm.session.SessionFactory.metaData()Lorg/neo4j/ogm/MetaData;
这是我在 PersistenceContext.java 中的代码 package yuzhaoLiu.project.testNeo4j; import org.neo4j.ogm.config.C
java - org.neo4j.ogm.exception.ServiceNotFoundException : Driver: org. neo4j.ogm.drivers.http.driver.HttpDriver
我是 Neo4J 的新手，正在尝试通过 java 连接到 Neo4J 服务器。我的一个独立项目的pom入口如下: org.neo4j neo4j-o
Hibernate OGM Neo4j (5.0) Wildfly 10 错误。提供者 org.hibernate.ogm.service.impl.OgmIntegrator 不是子类型
部署 ear 时出现此错误。 org.jboss.msc.service.StartException in service jboss.persistenceunit."test.ear/serve
Neo4j OGM 和与子类的关系
Neo4j OGM 遇到问题库并与“子类”有关系: @NodeEntity class MyEntity{ @GraphId private Long graphId; ... } c
java - Neo4j OGM 和多个类似的类
我正在使用 Neo4j ogm 将许多(超过 20 个)类似的类映射到 neo4j db 中，这些类的不同之处在于关系名称、名称和方向。每个类都仅使用一个相同的方法来实现“Classification
java - neo4j ogm，获取与特定查询匹配的节点数
我的 graphDb 中有 3 种类型的节点。技能、SkillSubCluster 和SkillCluster。一个 Skill 节点连接到一个或多个 SkillSubCluster 节点(一对多关
java - Neo4j OGM 与界面配合良好吗？
我开发了两组类 - 第一个只是类，而在第二组中，类派生自接口(interface)。两组类都互相模仿。它们的存储库也相似。但是，存储库对于第一组类(节点和关系)效果很好。对于第二组类，存储库能够插入记
java - Neo4j-OGM 关系未加载
在我的项目中，我有MapNodes，它们通过关系ConnectRelation连接。 ConenctRelation 有一个属性长度。节点及其关系毫无问题地保存到 Neo4J 数据库中。但是当加载节点
java - Neo4j OGM 字段不继承
我遇到了 neo4j OGM 的问题图书馆，我已按照图书馆 docs page 上的说明进行操作实现一个抽象父实体以包含我的实体的所有共享字段和功能。然后，当我用具体的类继承此类并尝试执行 sessi
java - Neo4j OGM 关系仅在一个实体中
我有两个 NodeEntity 类，它们以多对一关系相关(如多对一)。假设许多实体 A 与单个实体 B 相关。我希望能够加载深度大于 0 的实体 B，但不加载许多相关实体 A，并且实际上不需要访问实体
java - Hibernate OGM 分页滚动
假设我们有一个巨大的 mongodb 集合(大约 60,000,000 条记录)，并且我们希望滚动它，当然不想获取大量内存。对于 Hibernate orm 来说，这是可能的，因为有滚动 api 和条
python - py2neo ogm 与多个节点标签的关系
我想使用 py2neo 的 OGM 来表示从一种节点类型到两种节点类型的关系。我有一个解决方案(如下)，仅适用于在数据库中存储节点/关系，并且我找不到在检索关系时正常工作的解决方案。这是我的例子。
java - Neo4J OGM 中的设置关系属性
我昨天发现了 Neo4j OGM，并迅速创建了一个新项目来测试它的工作原理。我遇到的一个问题是设置 Relationhip 属性，因为这对我的项目至关重要。这是一个例子: 房间节点: @NodeEnt
java - Neo4j-ogm 查询路径
在我的 Java 代码中，我有一个查询来匹配树中从根到叶子的最短路径。 Strinq query = "Match path = (p:Root)-[*1..100]-(m:Leaf) " +
java - Neo4j OGM 图覆盖事务内的更改
我们觉得我们终于对 Neo4j-ogm 中看到的奇怪行为有了解释。我们最初认为这与 equals/hashcode 实现有关，但事实并非如此。似乎 ogm 保留了图的缓存副本，并且在事务内所有检索都
java - Neo4j OGM 映射异常
我正在尝试获取 OGM 上密码查询的结果。基本上，我一直在关注本教程:OGM Tutorial . 我有一个实体接口(interface)(与教程中的接口(interface)相同): pub
Neo4j - OGM 在 Kotlin 中抛出的不是实体
正如上面的图块，我一直在尝试使用 neo4j-ogm 和 kotlin，但没有成功。如果我尝试保留我的数据，Neo4j 会抛出异常，“类 xxxx 不是有效实体”。 package com.asoft
jpa - Hibernate OGM vs. 昆德拉
有人对 Hibernate OGM 与 Kundera 的使用有反馈吗？我知道这两个框架正在为 NoSQL 解决方案提供 Java 持久性 (JPA) 支持，我想从研究过这两个框架的人的经验中受益。听

首页

博学

6Ren·AI

商城

java - Hibernate OGM 分页滚动