- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
假设我们有一个巨大的 mongodb 集合(大约 60,000,000 条记录),并且我们希望滚动它,当然不想获取大量内存。对于 Hibernate orm 来说,这是可能的,因为有滚动 api 和条件查询,但是 OGM 中分页的解决方案是什么(已经花了很多时间,但我找不到东西)?我使用 setFirstResult-setMaxResult Api 批量索引 50,000 个对象。这些是从查询中获取批处理的时间(以秒为单位),例如
em.createNativeQuery(query, Entity.class).setFirstResult(i).setMaxResults(batchSize).getResultList()
results.stream().forEach(res -> fullTextEntityManager.index(res));
通过在每次迭代中增加 i ,例如 i+=batchSize;
我已经尝试使用 OgmMassIndexer,但我需要能够启动-停止、索引特定范围,所以我更喜欢手动执行。
显而易见且合乎逻辑的是,每次迭代中查找第一个结果的时间正在增加。这里我有时间以秒为单位从400万开始找到下一批50000(setFirstResult(4000000).setMaxResult(50000)):
例如。到 4000000 需要 17 秒等。 到 4050000 需要 15 秒等。 到 4100000 需要 12 秒等。但后来这个数字增加了很多:发现:17找到:15找到:12找到:13找到:13找到:13找到:15找到:16找到:16发现: 17找到:18找到:18发现: 19发现: 19找到:20找到:20找到: 21找到: 21找到:22找到: 21找到:22找到:23找到:23找到:23找到: 24找到: 24找到:25找到:25找到: 26找到: 26找到: 27找到: 28找到: 27找到: 29找到: 29找到:30找到: 31找到: 32找到: 33找到:30找到: 33找到: 32找到:34找到:34找到:35找到:35找到: 38找到:36找到: 38找到:36找到: 41找到: 41找到: 39找到: 41找到: 41找到:40找到: 42找到: 43找到: 42找到:44找到:44找到:45找到: 47找到:45找到:44找到:44找到: 47找到:44找到: 47找到: 47找到:50找到: 52找到:93
有没有使用 ogm 游标滚动 mongodb 或其他东西来获取 session 中的对象并有效地索引它们的选项?我的意思是,即使对于想要在不使用 Hibernate Search 的情况下使用 OGM 对大量数据进行分页的应用程序来说,这也是不可行的,所以我想有一个我看不到的解决方案。
非常感谢。
使用 ElasticSearch 的 Hibernate OGM 5.3.1、Hibernate Search 5.9.0
最佳答案
OGM 尚不支持滚动,因为它需要不受支持的 Criteria API。
话虽这么说,您可以以不同的方式实现您的流程。
我假设这个过程变得越来越慢来自查询部分(MongoDB 越来越难找到第 N 个结果),而不是来自索引部分(Elasticsearch 越来越难将文档添加到索引)。
如果是这种情况,您可以尝试“分块”查询而不是分页。这个想法是首先检索要索引的实体类型的第一个和最后一个 ID,然后不使用分页,而是使用类似于 where ID between <last ID in the previous query + 1> AND <last ID in the previous query + page size>
的条件运行查询。 .
假设 ID 字段在 MongoDB 中具有升序索引,这应该可以避免性能随着时间的推移而变差。
关于java - Hibernate OGM 分页滚动,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49799883/
到目前为止,我一直在我的项目中使用嵌入式 Neo4j 服务器。现在我想使用独立服务器尝试新的 Bolt 协议(protocol),但仅限于我部署的应用程序。为了方便起见,我仍然想在从 IDE 运行(永
使用 session.load() 查询深度 2 时出现超时.我正在使用 Neo4j OGM 1.1.3(尝试从 Spring Data Neo4j 3.4 迁移)。尝试加载 Node 对象 clas
这是我在 PersistenceContext.java 中的代码 package yuzhaoLiu.project.testNeo4j; import org.neo4j.ogm.config.C
我是 Neo4J 的新手,正在尝试通过 java 连接到 Neo4J 服务器。 我的一个独立项目的pom入口如下: org.neo4j neo4j-o
部署 ear 时出现此错误。 org.jboss.msc.service.StartException in service jboss.persistenceunit."test.ear/serve
Neo4j OGM 遇到问题库并与“子类”有关系: @NodeEntity class MyEntity{ @GraphId private Long graphId; ... } c
我正在使用 Neo4j ogm 将许多(超过 20 个)类似的类映射到 neo4j db 中,这些类的不同之处在于关系名称、名称和方向。每个类都仅使用一个相同的方法来实现“Classification
我的 graphDb 中有 3 种类型的节点。 技能、SkillSubCluster 和SkillCluster。一个 Skill 节点连接到一个或多个 SkillSubCluster 节点(一对多关
我开发了两组类 - 第一个只是类,而在第二组中,类派生自接口(interface)。两组类都互相模仿。它们的存储库也相似。但是,存储库对于第一组类(节点和关系)效果很好。对于第二组类,存储库能够插入记
在我的项目中,我有MapNodes,它们通过关系ConnectRelation连接。 ConenctRelation 有一个属性长度。节点及其关系毫无问题地保存到 Neo4J 数据库中。但是当加载节点
我遇到了 neo4j OGM 的问题图书馆,我已按照图书馆 docs page 上的说明进行操作实现一个抽象父实体以包含我的实体的所有共享字段和功能。然后,当我用具体的类继承此类并尝试执行 sessi
我有两个 NodeEntity 类,它们以多对一关系相关(如多对一)。假设许多实体 A 与单个实体 B 相关。我希望能够加载深度大于 0 的实体 B,但不加载许多相关实体 A,并且实际上不需要访问实体
假设我们有一个巨大的 mongodb 集合(大约 60,000,000 条记录),并且我们希望滚动它,当然不想获取大量内存。对于 Hibernate orm 来说,这是可能的,因为有滚动 api 和条
我想使用 py2neo 的 OGM 来表示从一种节点类型到两种节点类型的关系。 我有一个解决方案(如下),仅适用于在数据库中存储节点/关系,并且我找不到在检索关系时正常工作的解决方案。 这是我的例子。
我昨天发现了 Neo4j OGM,并迅速创建了一个新项目来测试它的工作原理。我遇到的一个问题是设置 Relationhip 属性,因为这对我的项目至关重要。这是一个例子: 房间节点: @NodeEnt
在我的 Java 代码中,我有一个查询来匹配树中从根到叶子的最短路径。 Strinq query = "Match path = (p:Root)-[*1..100]-(m:Leaf) " +
我们觉得我们终于对 Neo4j-ogm 中看到的奇怪行为有了解释。我们最初认为这与 equals/hashcode 实现有关,但事实并非如此。 似乎 ogm 保留了图的缓存副本,并且在事务内所有检索都
我正在尝试获取 OGM 上密码查询的结果。基本上,我一直在关注本教程:OGM Tutorial . 我有一个实体接口(interface)(与教程中的接口(interface)相同): pub
正如上面的图块,我一直在尝试使用 neo4j-ogm 和 kotlin,但没有成功。如果我尝试保留我的数据,Neo4j 会抛出异常,“类 xxxx 不是有效实体”。 package com.asoft
有人对 Hibernate OGM 与 Kundera 的使用有反馈吗?我知道这两个框架正在为 NoSQL 解决方案提供 Java 持久性 (JPA) 支持,我想从研究过这两个框架的人的经验中受益。听
我是一名优秀的程序员,十分优秀!