- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
假设我们有一个巨大的 mongodb 集合(大约 60,000,000 条记录),并且我们希望滚动它,当然不想获取大量内存。对于 Hibernate orm 来说,这是可能的,因为有滚动 api 和条件查询,但是 OGM 中分页的解决方案是什么(已经花了很多时间,但我找不到东西)?我使用 setFirstResult-setMaxResult Api 批量索引 50,000 个对象。这些是从查询中获取批处理的时间(以秒为单位),例如
em.createNativeQuery(query, Entity.class).setFirstResult(i).setMaxResults(batchSize).getResultList()
results.stream().forEach(res -> fullTextEntityManager.index(res));
通过在每次迭代中增加 i ,例如 i+=batchSize;
我已经尝试使用 OgmMassIndexer,但我需要能够启动-停止、索引特定范围,所以我更喜欢手动执行。
显而易见且合乎逻辑的是,每次迭代中查找第一个结果的时间正在增加。这里我有时间以秒为单位从400万开始找到下一批50000(setFirstResult(4000000).setMaxResult(50000)):
例如。到 4000000 需要 17 秒等。 到 4050000 需要 15 秒等。 到 4100000 需要 12 秒等。但后来这个数字增加了很多:发现:17找到:15找到:12找到:13找到:13找到:13找到:15找到:16找到:16发现: 17找到:18找到:18发现: 19发现: 19找到:20找到:20找到: 21找到: 21找到:22找到: 21找到:22找到:23找到:23找到:23找到: 24找到: 24找到:25找到:25找到: 26找到: 26找到: 27找到: 28找到: 27找到: 29找到: 29找到:30找到: 31找到: 32找到: 33找到:30找到: 33找到: 32找到:34找到:34找到:35找到:35找到: 38找到:36找到: 38找到:36找到: 41找到: 41找到: 39找到: 41找到: 41找到:40找到: 42找到: 43找到: 42找到:44找到:44找到:45找到: 47找到:45找到:44找到:44找到: 47找到:44找到: 47找到: 47找到:50找到: 52找到:93
有没有使用 ogm 游标滚动 mongodb 或其他东西来获取 session 中的对象并有效地索引它们的选项?我的意思是,即使对于想要在不使用 Hibernate Search 的情况下使用 OGM 对大量数据进行分页的应用程序来说,这也是不可行的,所以我想有一个我看不到的解决方案。
非常感谢。
使用 ElasticSearch 的 Hibernate OGM 5.3.1、Hibernate Search 5.9.0
最佳答案
OGM 尚不支持滚动,因为它需要不受支持的 Criteria API。
话虽这么说,您可以以不同的方式实现您的流程。
我假设这个过程变得越来越慢来自查询部分(MongoDB 越来越难找到第 N 个结果),而不是来自索引部分(Elasticsearch 越来越难将文档添加到索引)。
如果是这种情况,您可以尝试“分块”查询而不是分页。这个想法是首先检索要索引的实体类型的第一个和最后一个 ID,然后不使用分页,而是使用类似于 where ID between <last ID in the previous query + 1> AND <last ID in the previous query + page size>
的条件运行查询。 .
假设 ID 字段在 MongoDB 中具有升序索引,这应该可以避免性能随着时间的推移而变差。
关于java - Hibernate OGM 分页滚动,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49799883/
什么是 hibernate 和n- hibernate ?我可以在 Visual Studio 2008 中使用它进行 C# Web 应用程序开发吗?请给我建议...我是 asp.net Web 应用
我有一个不系统地发生的异常(exception)。 我试图通过在每次迭代中刷新和清理 session 来解决此问题,但没有成功。 [quartzScheduler_Worker-7] ERROR jd
使用 Hibernate 在数据库中存储 IP 地址的最佳类型是什么? 我虽然是 Byte[] 或 String,但有没有更好的方法,或者你用什么? @Column(name = "range_fr
我正在尝试制定一个公式来选择用户个人资料的用户友好名称。它选择名字 + ' ' + 姓氏 如果其中至少有一个不为空且不为空(包含非空白字符),否则选择 短名称 (条件相同),最后,如果 短名称 为空或
在hibernate中,是否可以将鉴别器作为一个实体?例如,如果我将 Department 作为基类,将 AdminDepartment 和 ProcessingDepartment 作为子类。 De
我只想从表中获取一些列值。因此,我已经使用投影来实现这一目标。该代码有效,但我认为它无效。 我的问题是当我使用ProjectionsList并将标准条件列表设置为ArrayList时-Bulletin
你好: 我对 hibernate 缓存缓存的内容感到困惑。 从文档中,我知道 hibernate 中有缓存类型。 一级 :交易级别。 似乎要被 session 持久化的实体被缓存在这里。 二级缓存 :
我遇到了一个情况: save或update hibernate 的目标表中的某些数据 在目标表上有一个触发器,该触发器将在目标表的insert或update操作之前执行 由 hibernate 将此记
我有一个名为 Master_Info_tbl 的表。它是一个查询表: 这是该表的代码: @Entity @Table(name="MASTER_INFO_T") public class Code
我想知道如何在 Hibernate 查询语言中使用日期文字。我在我的 JPA 项目中做了如下操作(作为 Eclipselink 提供者)并且它工作正常。 SELECT m FROM Me m WHER
@Entity public class Troop { @OneToMany(mappedBy="troop") public Set getSoldiers() { ...
我正在尝试使用 hibernate 查询删除表 'user_role' 中的所有行。但每次我都会出错。有人可以帮我吗。 DaoImpl @Override public void deleteAll(
不是将数据库操作分散在四个 (osgi) 包中,而是在那里做略有不同的事情。我想创建一个负责所有持久性问题的(简单的)OSGi 包。我觉得这并不像听起来那么简单,因为“每个包都有独特的类加载器”。 因
这就是我使用生成器的方式: private Integer id; 我看到的行为是: 创建第一个对象 hibernate 分配 id = 1 删除该对象 关闭服务
对象级别的实体和值类型有什么区别。我知道实体将有一个 id 但值不会,但为什么我们需要不同的方法来映射实体与值类型? 这样做是为了让hibernate可以对值类型应用任何优化吗? 最佳答案 一个实体已
我正在使用 HibernateTemplate.findByCriteria 方法进行一些查询。现在我想在标准上创建一些 SQL 限制,比如 criteria.add(Restrictions.sql
所以我有以下代码: Query query = session.createQuery("from Weather"); List list = query.list();
如何使用Hibernate映射具有多个实体的 View ? 问候, 混沌 最佳答案 请参见Hibernate文档中第5.1.3节“类”,紧接在“Id”节之前: There is no differen
据我所知,Hibernate 有两种类型的实现 JPA的实现(2)(@Entity,@Table注解) 扩展到旧的(传统的) hibernate (没有 JPA),使用 HSQL 查询,没有注释 如果
我需要一个将条目存储为键值对的集合(因此我可以通过键查找值),但我需要一个允许多个值使用 hibernate 共享同一个键的集合 最佳答案 一个键具有多个值的映射称为多映射 - 在 Apache 公共
我是一名优秀的程序员,十分优秀!