java - Hibernate Search 5.5.2 - 具有许多关联的对象的索引更新性能较差-6ren

java - Hibernate Search 5.5.2 - 具有许多关联的对象的索引更新性能较差

转载作者：行者123 更新时间：2023-11-30 07:20:39

41

4

我在使用 Hibernate Search 时遇到了严重的性能问题。似乎当我保存/更新/删除通过 @IndexedEmbedded 或 @ContainedIn 引用的实体时 - 父索引实体会经历作为索引图一部分的所有惰性集合的完整初始化。在某些情况下，这是初始化并从数据库中获取数千个关联对象。我不确定这是否是预期的行为，但我想只有正在更新/添加的字段需要在索引中更新/添加，并且不明白为什么我的惰性集合需要初始化。

下面是简化的代码，显示了我如何设置实体和搜索图:

@Entity
@Inheritance(strategy = InheritanceType.JOINED)
public class Profile {

    @Id
    public int id;
    @Field
    public String name;

    @IndexedEmbedded(includePaths = "name")
    @ManyToOne(fetch = FetchType.LAZY)
    @JoinColumn(referencedColumnName = "id")
    public Profile parentProfile;

    @ContainedIn
    @OneToMany(mappedBy = "parentProfile")
    public Set<Profile> childrenProfiles = new HashSet<Profile>();

    @IndexedEmbedded(includePaths = { "id.userId" })
    @OneToMany(mappedBy = "profile")
    public Set<AdminMap> adminMap = new HashSet<AdminMap>();

    @IndexedEmbedded(includePaths = { "id.userId" })
    @OneToMany(mappedBy = "profile")
    public Set<FavouritesMap> favouritesMap = new HashSet<FavouritesMap>();

}

@Indexed
@Entity
public class BusinessProfile extends Profile {...}

@Indexed
@Entity
public class UserProfile extends Profile {...}

@Entity
public class FavouritesMap {

    @EmbeddedId
    @IndexedEmbedded
    public FavouritesMapId id;

    @ContainedIn
    @ManyToOne
    @JoinColumn(insertable = false, updatable = false)
    public Profile profile;

    @ManyToOne
    @JoinColumn(insertable = false, updatable = false)
    public User user;

}

@Embeddable
public class FavouritesMapId {

    @Field
    public int userId;
    public int profileId;
}

因此，我们有一个 Profile 实体，它可以有 1 个父级和多个子级。配置文件还具有一组作为配置文件管理员的用户 (adminMap)，以及一组 Collection 该配置文件的用户 (favouritesMap)。我已经包含了 FavouritesMap 实体类和关联的 id 类，AdminMap 遵循相同的结构。 Profile 实体不是直接索引的，但它的扩展类型是。

这是用户执行“Collection ”个人资料操作时的代码:

public FavouritesMap setAsFavourite(int userId, int profileId) {
    FavouritesMap fav = new FavouritesMap(new FavouritesMapId(userId, profileId));

    Profile profile = (Profile)entityManager.findById(Profile.class, profileId);
    fav.setProfile(profile);

    entityManager.save(fav);

    return fav;
}

我期望发生的是，当我们调用entityManager.save(fav)时，hibernate搜索会看到@ContainedIn字段“profile”，查找该配置文件项的索引，然后添加新字段(favouritesMap. id.userId) 到索引中的该配置文件项目。

但是，似乎正在发生的情况是，hibernate 搜索正在初始化配置文件实体中的所有集合(adminMap、favouritesMap 和childrenProfiles)。在我的某些情况下，这会导致获取数千个关联实体，从而导致巨大的性能问题。这可以通过 setAsFavourite 方法返回一个 FavouritesMap 对象来证明，其中配置文件字段的集合已全部初始化。如果我删除 hibernate 搜索注释，则该对象将正确返回未初始化的惰性集合，表明这是 hibernate 搜索问题。

所以我的问题是，在通过 @ContainedIn 引用添加项目时， hibernate 搜索初始化所有这些惰性集合并重新索引所有字段的正确行为是否正确？如果是这样，...为什么？当然，它只需要添加一个新字段，而不是重新验证该实体的整个索引。如果没有，我的设置是否存在任何明显的错误，或者我如何最好地调试此问题？

谢谢

最佳答案

您的观察是正确的，简短的答案是:这是必需的。

任何更新都需要完全重写 Lucene 文档，即使只有一个字段发生变化。

请记住，Lucene 不是关系数据库:您不能只更新一个“列”，而是需要您再次编写文档，本质上是删除前一个文档并重新插入一个新副本。

无法读取现有文档，因为索引通常不是双向转换，这需要将所有字段标记为“已存储” - 从性能角度来看，这也是不可取的。即使您将所有字段标记为已存储，由于操作的重新排序，读取索引文档仍然不安全，并且可能会导致最终索引状态不一致。

Hibernate Search 包含“脏检查”策略，这些策略超出了 Hibernate ORM 所应用的策略:我们努力确定是否无法跳过索引更新，但如果需要进行写入，则确实需要完整的图被阅读以生成新的文档。

除了尝试限制索引的递归字段的深度之外，一种常见的技术是启用二级缓存并确保在频繁读取的关联上广泛启用它。

尤其重要的是，请确保使用以下选项清楚地界定您实际需要索引的对象图:

@IndexedEmbedded(includePaths)
@IndexedEmbedded(深度)

默认情况下索引的分支可能多于您实际需要的分支。

将来，我们计划能够通过使用显式索引时间连接将文档“分解”为两部分，但即使我们这样做，您也需要牢记这一限制，因为 Lucene 不会这样做不支持关系数据库可以提供的同类联接:我们可能只能在一个特定点拆分文档(只能考虑一个联接)。

关于java - Hibernate Search 5.5.2 - 具有许多关联的对象的索引更新性能较差，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/37627637/

41

4

0

文章推荐： java - Grails 映射基本集合类型

文章推荐： Java，评估错误

文章推荐： java - 使用 GSON 和 Hibernate Entity 创建自定义 JSON

java - 对象 a = 对象 b；对象 a 会发生什么？
我的一位教授给了我们一些考试练习题，其中一个问题类似于下面(伪代码): a.setColor(blue); b.setColor(red); a = b; b.setColor(purple); b
JavaScript 测试(对象 && 对象 !== "null"&& 对象 !== "undefined")
我似乎经常使用这个测试 if( object && object !== "null" && object !== "undefined" ){ doSomething(); } 在对象上，我
C#对象/对象
C# Object/object 是值类型还是引用类型？我检查过它们可以保留引用，但是这个引用不能用于更改对象。 using System; class MyClass { public s
javascript - 通过ajax发送json - 对象 - 对象
我在通过 AJAX 发送 json 时遇到问题。 var data = [{"name": "Will", "surname": "Smith", "age": "40"},{"name": "Wil
javascript - 如何获取值[对象][对象]
当我尝试访问我的 View 中的对象 {{result}} 时(我从 Express js 服务器发送该对象)，它只显示 [object][object]有谁知道如何获取 JSON 格式的值吗？这是
java - 对象...对象[] 和格式
我有不同类型的数据(可能是字符串、整数......)。这是一个简单的例子: public static void main(String[] args) { before("one"); }
javascript - 如何修复[对象，对象]
嗨，我是 json 和 javascript 的新手。我在这个网站找到了使用json数据作为表格的方法。我很好奇为什么当我尝试使用 json 数据作为表时，我得到 [Object,Object]
JavaScript [对象][对象] 调试
已关闭。此问题需要 debugging details 。目前不接受答案。编辑问题以包含 desired behavior, a specific problem or error, and the
java - 对象==空或空==对象？
我听别人说 null == object 比 object == null check 例如: void m1(Object obj ) { if(null == obj) // Is thi
VBS教程：对象-Match 对象
Match 对象提供了对正则表达式匹配的只读属性的访问。说明 Match 对象只能通过 RegExp 对象的 Execute 方法来创建，该方法实际上返回了 Match 对象的集合。所有的
VBS教程：对象-Class 对象
Class 对象使用 Class 语句创建的对象。提供了对类的各种事件的访问。说明不允许显式地将一个变量声明为 Class 类型。在 VBScript 的上下文中，“类对象”一词指的是用
VBS教程：对象-Folder 对象
Folder 对象提供对文件夹所有属性的访问。说明以下代码举例说明如何获得 Folder 对象并查看它的属性： Function ShowDateCreated(f
VBS教程：对象-File 对象
File 对象提供对文件的所有属性的访问。说明以下代码举例说明如何获得一个 File 对象并查看它的属性： Function ShowDateCreated(fil
VBS教程：对象-Drive 对象
Drive 对象提供对磁盘驱动器或网络共享的属性的访问。说明以下代码举例说明如何使用 Drive 对象访问驱动器的属性： Function ShowFreeSpac
VBS教程：对象-FileSystemObject 对象
FileSystemObject 对象提供对计算机文件系统的访问。说明以下代码举例说明如何使用 FileSystemObject 对象返回一个 TextStream 对象，此对象可以被读
对象
我是 javascript OOP 的新手，我认为这是一个相对基本的问题，但我无法通过搜索网络找到任何帮助。我是否遗漏了什么，或者我只是以错误的方式解决了这个问题？这是我的示例代码: functio
对象
我可以很容易地创造出很多不同的对象。例如像这样: var myObject = { myFunction: function () { return ""; } };
对象
function Person(fname, lname) { this.fname = fname, this.lname = lname, this.getName = function()
javascript - JSON 返回(对象，对象)
任何人都可以向我解释为什么下面的代码给出 (object, Object) 吗？ (console.log(dope) 给出了它应该的内容，但在 JSON.stringify 和 JSON.parse
javascript - 返回 [对象，对象] 的工具提示
我正在尝试完成散点图 exercise来自免费代码营。然而，我现在只自己学习了 d3 几个小时，在遵循 lynda.com 的教程后，我一直在尝试确定如何在工具提示中显示特定数据。 This code

首页

博学

6Ren·AI

商城

java - Hibernate Search 5.5.2 - 具有许多关联的对象的索引更新性能较差