hibernate - Hibernate使用flushMode = AUTO查询要慢得多，直到调用clear()为止-6ren

hibernate - Hibernate使用flushMode = AUTO查询要慢得多，直到调用clear()为止

转载作者：行者123 更新时间：2023-12-03 12:56:33

29

4

我有一个使用Hibernate(通过JPA)的长期运行(但相当简单)的应用程序。运行时，它正在经历相当大的减速。我已经缩小到偶尔需要entityManager.clear()调用的范围。当Hibernate的实体管理器跟踪100,000个实体时，它的速度要比仅跟踪几个实体时慢100倍(请参见下面的结果)。 我的问题是:为什么Hiberate在跟踪大量实体时会放慢速度呢？还有其他解决方法吗？

!!!更新:我已经能够将其范围缩小到Hibernate的自动刷新代码。 !!!

专门针对org.hibernate.event.internal.AbstractFlushingEventListener的flushEntities()方法(至少在Hibernate 4.1.1.Final中)。在其中，存在一个循环，在持久性上下文中循环访问所有实体，围绕刷新它们中的每一个执行一些广泛的检查(即使在我的示例中所有实体都已刷新!)。

因此，部分回答了我的问题的第二部分，可以通过将刷新模式设置为查询上的FlushModeType.COMMIT来解决性能问题(请参见下面的更新结果)。例如

Place place = em.createQuery("from Place where name = :name", Place.class)
    .setParameter("name", name)
    .setFlushMode(FlushModeType.COMMIT)  // <-- yay!
    .getSingleResult();

...但是，这似乎是一个非常丑陋的解决方案-将知道事情是否已刷新到查询方法的责任交给了责任，而不是将其保留在更新方法中。这也几乎意味着我要么必须在所有查询方法上将刷新模式设置为COMMIT，要么更可能是在EntityManager上对其进行设置。

这让我感到奇怪:这是预期的行为吗？我在刷新或在定义实体时做错了什么吗？还是这是Hibernate的限制(或可能是Bug)？

我用来解决问题的示例代码如下:

测试实体

@Entity @Table(name="place") @Immutable
public class Place {
    private Long _id;
    private String _name;

    @Id @GeneratedValue
    public Long getId() { return _id; }
    public void setId(Long id) { _id = id; }

    @Basic(optional=false) @Column(name="name", length=700,
        updatable=false, nullable=false, unique=true,
        columnDefinition="varchar(700) character set 'ascii' not null")
    public String getName() { return _name; }
    public void setName(String name) { _name = name; }

    @Override
    public boolean equals(Object o) { /* ... */ }

    @Override
    public int hashCode() { return getName().hashCode(); }
}

基准代码

我拥有的测试代码会生成100000个随机地名并将其插入。然后按名称随机查询出5000个。名称列上有一个索引。

Place place = em.createQuery(
    "select p from Place p where p.name = :name", Place.class)
    .setParameter("name", name)
    .getSingleResult();

为了进行比较，并确保它不是数据库中的内容，我在单独的随机选择的5000个地名上运行了以下基于JDBC的查询(在 em.unwrap(Session.class).doWork(...)下):

PreparedStatement ps = c.prepareStatement(
    "select id, name from place where name = ?");
ps.setString(1, name);
ResultSet rs = ps.executeQuery();
while (rs.next()) {
    Place place = new Place();
    place.setId(rs.getLong(1));
    place.setName(rs.getString(2));
}
rs.close();
ps.close();

(请注意，我确实为基准的5000个查询中的每个查询创建并关闭了PreparedStatement)。

结果

以下所有结果平均超过5000个查询。 JVM被赋予了 -Xmx1G

Seconds/Query    Approach
0.000160s        JDBC
0.000286s        Hibernate calling clear() after import and every 100 queries
0.000653s        Hibernate calling clear() once after the import
0.012533s        Hibernate w/o calling clear() at all
0.000292s        Hibernate w/o calling clear(), and with flush-mode COMMIT

其他观察结果:在Hibernate查询期间(不进行任何明确的调用)，java进程将内核的利用率接近100％。 JVM从未超过500MB堆。查询期间也有很多GC Activity ，但是CPU利用率显然由Hibernate代码支配。

最佳答案

But mainly I'm curious why Hibernate seems to exhibit O(n) or even O(n^2) lookups for the queries--seems like it should be able to use a hashtable or binary-tree under the hood to keep the queries fast. Notice the 2-orders-of-magnitude difference when its tracking 100000 entities vs 100 entities.

O(n²)复杂度来自查询处理方式。由于Hibernate在内部尽可能长地延迟更新和插入(以利用机会将相似的更新/插入分组在一起，特别是在设置对象的多个属性的情况下)。

因此，在保存查询数据库中的对象之前，Hibernate必须检测所有对象更改并刷新所有更改。这里的问题是，休眠状态也正在进行一些通知和拦截。因此，它将遍历持久性上下文管理的每个实体对象。即使对象本身不是可变的，它也可能包含可变的对象甚至引用集合。

此外，拦截机制还允许您访问任何被认为是脏对象的对象，以允许您自己的代码实现其他脏度检查或执行其他计算，例如计算总和，平均值，记录其他信息等。

但是让我们看一下代码:

准备查询的冲洗调用结果如下:

DefaultFlushEventListener.onFlush(..)

-> AbstractFlushingEventListener.flushEverythingToExecution(事件)
-> AbstractFlushingEventListener.prepareEntityFlushes(..)

该实现使用:

for ( Map.Entry me : IdentityMap.concurrentEntries( persistenceContext.getEntityEntries() ) ) {
        EntityEntry entry = (EntityEntry) me.getValue();
        Status status = entry.getStatus();
        if ( status == Status.MANAGED || status == Status.SAVING || status == Status.READ_ONLY ) {
            cascadeOnFlush( session, entry.getPersister(), me.getKey(), anything );
        }
    }

如您所见，持久性上下文中所有实体的映射都被检索和迭代。

这意味着对于查询的每次调用，您都将遍历所有以前的结果以检查脏对象。甚至更多的cascadeOnFlush都会创建一个新的Object，并做更多的事情。这是cascadeOnFlush的代码:

private void cascadeOnFlush(EventSource session, EntityPersister persister, Object object, Object anything)
throws HibernateException {
    session.getPersistenceContext().incrementCascadeLevel();
    try {
        new Cascade( getCascadingAction(), Cascade.BEFORE_FLUSH, session )
        .cascade( persister, object, anything );
    }
    finally {
        session.getPersistenceContext().decrementCascadeLevel();
    }
}

这就是解释。每次发出查询时，Hibernate只会检查由持久性上下文管理的每个对象。

因此，对于每个在这里阅读内容的人，都是复杂度计算:
1.查询:0个实体
2.查询:1个实体
3.查询:2个实体
..
100.查询:100个实体
。
..
100k +1查询:100k条目

因此我们有O(0 + 1 + 2 ... + n)= O(n(n + 1)/ 2)= O(n²)。

这解释了您的观察。为了保持较小的cpu和内存占用量，休眠管理的持久化上下文应保持尽可能小。让Hibernate管理超过100个或1000个实体会大大降低Hibernate的速度。在这里，应该考虑更改刷新模式，使用第二个 session 进行查询，然后使用一个 session 进行更改(如果可能的话)，或者使用StatelessSession。

因此，您的观察是正确的，这是O(n²)的结果。

关于hibernate - Hibernate使用flushMode = AUTO查询要慢得多，直到调用clear()为止，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/10143880/

29

4

0

文章推荐： react-native - 无法在 React Native >= 0.60 中链接 Assets (字体)

文章推荐： react-native - React-Native 上另一个组件的访问方法

文章推荐： hibernate - JPA/Hibernate Join 和 Fetch 单列

文章推荐： visual-studio-2010 - 在MAC OS X上打开Visual Studio项目

hibernate - 什么是 hibernate 和n- hibernate ？
什么是 hibernate 和n- hibernate ？我可以在 Visual Studio 2008 中使用它进行 C# Web 应用程序开发吗？请给我建议...我是 asp.net Web 应用
hibernate - grails/hibernate:在作业中获取org.hibernate.StaleStateException
我有一个不系统地发生的异常(exception)。我试图通过在每次迭代中刷新和清理 session 来解决此问题，但没有成功。 [quartzScheduler_Worker-7] ERROR jd
hibernate - hibernate 实体中IP地址的最佳类型？
使用 Hibernate 在数据库中存储 IP 地址的最佳类型是什么？我虽然是 Byte[] 或 String，但有没有更好的方法，或者你用什么？ @Column(name = "range_fr
hibernate - Hibernate @Formula中TRIM函数的参数数量错误
我正在尝试制定一个公式来选择用户个人资料的用户友好名称。它选择名字 + ' ' + 姓氏如果其中至少有一个不为空且不为空(包含非空白字符)，否则选择短名称 (条件相同)，最后，如果短名称为空或
hibernate - 鉴别器列映射为实体 Hibernate
在hibernate中，是否可以将鉴别器作为一个实体？例如，如果我将 Department 作为基类，将 AdminDepartment 和 ProcessingDepartment 作为子类。 De
hibernate - hibernate 投影列表
我只想从表中获取一些列值。因此，我已经使用投影来实现这一目标。该代码有效，但我认为它无效。我的问题是当我使用ProjectionsList并将标准条件列表设置为ArrayList时-Bulletin
hibernate - hibernate 缓存保存了什么？
你好: 我对 hibernate 缓存缓存的内容感到困惑。从文档中，我知道 hibernate 中有缓存类型。一级 :交易级别。似乎要被 session 持久化的实体被缓存在这里。二级缓存 :
hibernate - 数据库触发器和 hibernate
我遇到了一个情况: save或update hibernate 的目标表中的某些数据在目标表上有一个触发器，该触发器将在目标表的insert或update操作之前执行由 hibernate 将此记
hibernate - Hibernate JPA缓存
我有一个名为 Master_Info_tbl 的表。它是一个查询表: 这是该表的代码: @Entity @Table(name="MASTER_INFO_T") public class Code
hibernate - Hibernate 中的日期字面量
我想知道如何在 Hibernate 查询语言中使用日期文字。我在我的 JPA 项目中做了如下操作(作为 Eclipselink 提供者)并且它工作正常。 SELECT m FROM Me m WHER
hibernate - Hibernate 中的关系所有者是什么意思？
@Entity public class Troop { @OneToMany(mappedBy="troop") public Set getSoldiers() { ...
hibernate - 查询以删除表中的所有行 hibernate
我正在尝试使用 hibernate 查询删除表 'user_role' 中的所有行。但每次我都会出错。有人可以帮我吗。 DaoImpl @Override public void deleteAll(
hibernate - OSGi + hibernate
不是将数据库操作分散在四个 (osgi) 包中，而是在那里做略有不同的事情。我想创建一个负责所有持久性问题的(简单的)OSGi 包。我觉得这并不像听起来那么简单，因为“每个包都有独特的类加载器”。因
hibernate - hibernate 生成器如何增量句柄删除
这就是我使用生成器的方式: private Integer id; 我看到的行为是: 创建第一个对象 hibernate 分配 id = 1 删除该对象关闭服务
hibernate - hibernate 中的实体和值类型
对象级别的实体和值类型有什么区别。我知道实体将有一个 id 但值不会，但为什么我们需要不同的方法来映射实体与值类型？这样做是为了让hibernate可以对值类型应用任何优化吗？最佳答案一个实体已
hibernate - Hibernate 连接表的标准
我正在使用 HibernateTemplate.findByCriteria 方法进行一些查询。现在我想在标准上创建一些 SQL 限制，比如 criteria.add(Restrictions.sql
hibernate - 从表中全选 hibernate
所以我有以下代码: Query query = session.createQuery("from Weather"); List list = query.list();
hibernate - 查看与 hibernate
如何使用Hibernate映射具有多个实体的 View ？问候，混沌最佳答案请参见Hibernate文档中第5.1.3节“类”，紧接在“Id”节之前: There is no differen
hibernate - 为什么需要传统的 Hibernate？
据我所知，Hibernate 有两种类型的实现 JPA的实现(2)(@Entity，@Table注解) 扩展到旧的(传统的) hibernate (没有 JPA)，使用 HSQL 查询，没有注释如果
hibernate - Hibernate 中的多图
我需要一个将条目存储为键值对的集合(因此我可以通过键查找值)，但我需要一个允许多个值使用 hibernate 共享同一个键的集合最佳答案一个键具有多个值的映射称为多映射 - 在 Apache 公共

首页

博学

6Ren·AI

商城

hibernate - Hibernate使用flushMode = AUTO查询要慢得多，直到调用clear()为止