gpt4 book ai didi

java - 使用 JPA/Toplink 进行批量插入

转载 作者:行者123 更新时间:2023-12-04 07:12:33 25 4
gpt4 key购买 nike

我有一个通过 HTTP 接口(interface)接收消息的 Web 应用程序,例如:

http://server/application?source=123&destination=234&text=hello

该请求包含发件人的 ID、收件人的 ID 和消息的文本。

此消息应按如下方式处理:
  • 从数据库
  • 中为源和目标查找匹配的用户对象
  • 创建对象树:包含消息文本字段的 Message 和用于源和目标的两个 User 对象
  • 将此树持久化到数据库中。

  • 树将由我无法触及的其他应用程序加载。

    我使用 Oracle 作为后备数据库,使用 JPA 和 Toplink 进行数据库处理任务。如果可能的话,我会留在这些地方。

    如果没有太多优化,我可以在我的环境中实现约 30 个请求/秒的吞吐量。这并不多,我需要约 300 个请求/秒。所以我测量了性能瓶颈在哪里,发现对 em.persist() 的调用花费大部分时间。如果我简单地注释掉该行,吞吐量将远远超过 1000 个请求/秒。

    我尝试编写一个小型测试应用程序,它使用简单的 JDBC 调用将 100 万条消息持久保存到同一个数据库。我使用了批处理,这意味着我做了 100 次插入然后提交,并重复直到所有记录都在数据库中。在这种情况下,我测量了大约 500 个请求/秒的吞吐量,这可以满足我的需求。

    很明显,我需要在这里优化插入性能。然而,正如我之前提到的,我想继续使用 JPA 和 Toplink,而不是纯粹的 JDBC。

    你知道用 JPA 和 Toplink 创建批量插入的方法吗?您能否推荐任何其他技术来提高 JPA 持久性性能?

    附加信息:

    “请求/秒”在这里表示:请求总数/从测试开始到写入数据库的最后一条记录的总时间。

    我试图调用 em.persist()通过在 servlet 内容和持久化器之间创建一个内存队列来实现异步。对演出有很大帮助。然而队列确实增长得非常快,因为应用程序将连续接收约 200 个请求/秒,这对我来说不是一个可接受的解决方案。

    在这种分离的方法中,我收集了 100 毫秒的请求并调用了 em.persist()在提交事务之前在所有收集的项目上。 EntityManagerFactory 在每个事务之间缓存。

    最佳答案

    您应该与 JPA 接口(interface)分离并使用裸 TopLink API。您可能可以将您坚持的对象放入 UnitOfWork 并按您的计划提交 UnitOfWork(同步或异步)。请注意, em.persist() 的成本之一是整个对象图发生的隐式克隆。如果您自己 uow.registerObject() 您的两个用户对象,TopLink 会更好地工作,从而节省了它必须做的身份测试。所以你最终会得到:

    uow=sess.acquireUnitOfWork();
    for (job in batch) {
    thingyCl=uow.registerObject(new Thingy());
    user1Cl=uow.registerObject(user1);
    user2Cl=uow.registerObject(user2);
    thingyCl.setUsers(user1Cl,user2Cl);
    }
    uow.commit();

    顺便说一句,这是非常古老的 TopLink ;)

    请注意,批处理将有很大帮助,因为批处理写入,尤其是带有参数绑定(bind)的批处理写入将启动,对于这个简单的示例,这可能会对您的性能产​​生非常大的影响。

    其他要寻找的东西:您的测序大小。在 TopLink 中编写对象的大部分时间实际上都花在了从数据库中读取序列信息上,尤其是对于小的默认值(我的序列大小可能有几百甚至更多)。

    关于java - 使用 JPA/Toplink 进行批量插入,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/64781/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com