hibernate - hibernate 全文搜索-按相关性排序结果-6ren

hibernate - hibernate 全文搜索-按相关性排序结果

转载作者：行者123 更新时间：2023-12-03 02:19:58

我正在尝试使用Hibernate Search 5.5.0.Final进行全文查询(我已经尝试使用最新版本，但是由于我使用的是Hibernate的旧版本(5.0.12)而无法使用)。
我想要获得的最终结果如下:

Display at the top of the list the result that matches on the description field with the following logic:
    (Let' assume a user is searching "Milk")
    -Results having the word at the beginning (Milk UHT)
    -Results having the word in second or third position (Chocolate Milk)
    -Results having the word in a phrase(MilkShake)
Then displaying the result matching with the field tags (Lactose free, Gluten Free etc)

到目前为止，这是我所做的:

FullTextEntityManager fullTextEntityManager
            = Search.getFullTextEntityManager(entityManager);
    fullTextEntityManager.createIndexer().startAndWait();


    FullTextEntityManager fullTextEntityManager2
            = Search.getFullTextEntityManager(entityManager);

    QueryBuilder queryBuilder = fullTextEntityManager2.getSearchFactory()
            .buildQueryBuilder()
            .forEntity(ProductEntity.class)
            .get();


    Query myQuery = queryBuilder
            .bool()
            .should(queryBuilder.keyword()
                    .onField("description").boostedTo(9l).matching(query)
                    .createQuery())
            .should(queryBuilder.phrase()
                    .onField("description").boostedTo(5l).sentence(query)
                    .createQuery())

            .should(queryBuilder.keyword()
                    .onField("tags").boostedTo(3l).matching(query)
                    .createQuery())
            .should(queryBuilder.phrase()
                    .onField("tags").boostedTo(1l).sentence(query)
                    .createQuery())

            .createQuery();


    org.hibernate.search.jpa.FullTextQuery jpaQuery
            = fullTextEntityManager.createFullTextQuery(myQuery, ProductEntity.class);

    return jpaQuery.getResultList();

我在互联网上阅读了很多书，但仍然无法获得理想的结果。
这有可能吗？你能给我一个提示吗？
提前致谢

最佳答案

首先，要知道提升不是分配给每个查询的恒定权重；而是乘数。因此，当您在查询＃4上将boost设置为1并将在查询＃3上将boost设置为3时，如果它的基本得分是查询＃3的三倍以上，从理论上讲，查询＃4最终会以更高的“提升得分” 。为了避免这种问题，您可以将每个查询的分数标记为常量(使用.boostedTo(3l).withConstantScore().onField("tags")而不是.onField("tags").boostedTo(3l))。
其次，短语查询不是您想的那样。短语查询接受一个多词输入字符串，并将查找包含这些词的顺序相同的文档。由于您只通过了一个学期，所以毫无意义。所以您还需要其他东西。
查询1:结果以单词开头
我相信，准确地执行所需操作的唯一方法是跨度查询。但是，它们不是Hibernate Search DSL的一部分，因此您必须依赖于低级Lucene API。而且，我从未使用过它们，并且不确定如何使用它们。。。。。。。。。。。。。。。。。。。。。。。。。。。。
您可以尝试类似的方法，但是如果它不起作用，则您必须自己调试(我不知道比您了解更多):

    QueryBuilder queryBuilder = fullTextEntityManager2.getSearchFactory()
            .buildQueryBuilder()
            .forEntity(ProductEntity.class)
            .get();
    Analyzer analyzer = fullTextEntityManager.getSearchFactory()
            .getAnalyzer(ProductEntity.class);

    Query myQuery = queryBuilder
            .bool()
            .should(new BoostQuery(new ConstantScoreQuery(createSpanQuery(qb, "description", query, analyzer)), 9L))
            [... add other clauses here...]
            .createQuery();

// Other methods (to be added to the same class)

    private static Query createSpanQuery(QueryBuilder qb, String fieldName, String searchTerms, Analyzer analyzer) {
        BooleanJunction bool = qb.bool();
        List<String> terms = analyze(fieldName, searchTerms, analyzer);
       for (int i = 0; i < terms.size(); ++i) {
            bool.must(new SpanPositionRangeQuery(new SpanTermQuery(new Term( fieldName, terms.get(i))), i, i);
        }
        return bool.createQuery();
    }

    private static List<String> analyze(String fieldName, String searchTerms, Analyzer analyzer) {
        List<String> terms = new ArrayList<String>();
        try {
            final Reader reader = new StringReader( searchTerms );
            final TokenStream stream = analyzer.tokenStream( fieldName, reader );
            try {
                CharTermAttribute attribute = stream.addAttribute( CharTermAttribute.class );
                stream.reset();
                while ( stream.incrementToken() ) {
                    if ( attribute.length() > 0 ) {
                        String term = new String( attribute.buffer(), 0, attribute.length() );
                        terms.add( term );
                    }
                }
                stream.end();
            }
            finally {
                stream.close();
            }
        }
        catch (IOException e) {
            throw new IllegalStateException( "Unexpected exception while analyzing search terms", e );
        }
        return terms;
    }

查询2:将单词排在第二或第三位置的结果
我相信您可以使用与查询1相同的代码，但要添加一个偏移量。如果实际位置无关紧要，并且您将接受第四或第五位的单词，则只需执行以下操作:

queryBuilder.keyword().boostedTo(5l).withConstantScore()
        .onField("description").matching(query)
       .createQuery()

查询3:在词组中包含单词的结果(MilkShake)
据我了解，您的意思是“结果包含一个包含搜索词的单词”。
您可以为此使用通配符查询，但是不幸的是，这些查询不适用于分析器，从而导致区分大小写的搜索(以及其他问题)。
最好的选择可能是为此查询定义一个单独的字段，例如 description_ngram，并为其分配一个特制的分析器，该分析器在建立索引时使用ngram标记器。 ngram标记器只需输入一个输入字符串并将其转换为所有子字符串:“milkshake”将变为

["m", "mi", "mil", "milk", ..., "milkshake", "i", "il", "ilk", "ilks", "ilksh", ... "ilkshake", "l", ... "lkshake", ..., "ke", "e"]

。显然，这会占用大量磁盘空间，但可以用于小型数据集。
您将找到类似用例 Elasticsearch's documentation的说明。答案提到了一个不同的分析器“edgengram”，但是在您的情况下，您确实要使用“ngram”分析器。
另外，如果您确定索引文本的格式正确，可以清楚地区分“复合”字词的各个组成部分(例如“奶昔”，“奶昔”，...)，则只需创建一个字段(例如 description_worddelimiterfilter)使用带有词定界符过滤器的分析器(请参阅 org.apache.lucene.analysis.miscellaneous.WordDelimiterFilter)，该过滤器将拆分这些复合词。然后，您可以像这样简单地查询:

queryBuilder.keyword().boostedTo(3l).withConstantScore()
        .onField("description_worddelimiterfilter")
        .matching(query)
        .createQuery()

关于hibernate - hibernate 全文搜索-按相关性排序结果，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/62647105/

文章推荐： java - 使用JLGui更改系统音量

文章推荐： java - 在Java中使用.wav格式循环播放音频文件

文章推荐： actionscript-3 - 我认为Soundtransform无法正常工作

hibernate - 什么是 hibernate 和n- hibernate ？
什么是 hibernate 和n- hibernate ？我可以在 Visual Studio 2008 中使用它进行 C# Web 应用程序开发吗？请给我建议...我是 asp.net Web 应用
hibernate - grails/hibernate:在作业中获取org.hibernate.StaleStateException
我有一个不系统地发生的异常(exception)。我试图通过在每次迭代中刷新和清理 session 来解决此问题，但没有成功。 [quartzScheduler_Worker-7] ERROR jd
hibernate - hibernate 实体中IP地址的最佳类型？
使用 Hibernate 在数据库中存储 IP 地址的最佳类型是什么？我虽然是 Byte[] 或 String，但有没有更好的方法，或者你用什么？ @Column(name = "range_fr
hibernate - Hibernate @Formula中TRIM函数的参数数量错误
我正在尝试制定一个公式来选择用户个人资料的用户友好名称。它选择名字 + ' ' + 姓氏如果其中至少有一个不为空且不为空(包含非空白字符)，否则选择短名称 (条件相同)，最后，如果短名称为空或
hibernate - 鉴别器列映射为实体 Hibernate
在hibernate中，是否可以将鉴别器作为一个实体？例如，如果我将 Department 作为基类，将 AdminDepartment 和 ProcessingDepartment 作为子类。 De
hibernate - hibernate 投影列表
我只想从表中获取一些列值。因此，我已经使用投影来实现这一目标。该代码有效，但我认为它无效。我的问题是当我使用ProjectionsList并将标准条件列表设置为ArrayList时-Bulletin
hibernate - hibernate 缓存保存了什么？
你好: 我对 hibernate 缓存缓存的内容感到困惑。从文档中，我知道 hibernate 中有缓存类型。一级 :交易级别。似乎要被 session 持久化的实体被缓存在这里。二级缓存 :
hibernate - 数据库触发器和 hibernate
我遇到了一个情况: save或update hibernate 的目标表中的某些数据在目标表上有一个触发器，该触发器将在目标表的insert或update操作之前执行由 hibernate 将此记
hibernate - Hibernate JPA缓存
我有一个名为 Master_Info_tbl 的表。它是一个查询表: 这是该表的代码: @Entity @Table(name="MASTER_INFO_T") public class Code
hibernate - Hibernate 中的日期字面量
我想知道如何在 Hibernate 查询语言中使用日期文字。我在我的 JPA 项目中做了如下操作(作为 Eclipselink 提供者)并且它工作正常。 SELECT m FROM Me m WHER
hibernate - Hibernate 中的关系所有者是什么意思？
@Entity public class Troop { @OneToMany(mappedBy="troop") public Set getSoldiers() { ...
hibernate - 查询以删除表中的所有行 hibernate
我正在尝试使用 hibernate 查询删除表 'user_role' 中的所有行。但每次我都会出错。有人可以帮我吗。 DaoImpl @Override public void deleteAll(
hibernate - OSGi + hibernate
不是将数据库操作分散在四个 (osgi) 包中，而是在那里做略有不同的事情。我想创建一个负责所有持久性问题的(简单的)OSGi 包。我觉得这并不像听起来那么简单，因为“每个包都有独特的类加载器”。因
hibernate - hibernate 生成器如何增量句柄删除
这就是我使用生成器的方式: private Integer id; 我看到的行为是: 创建第一个对象 hibernate 分配 id = 1 删除该对象关闭服务
hibernate - hibernate 中的实体和值类型
对象级别的实体和值类型有什么区别。我知道实体将有一个 id 但值不会，但为什么我们需要不同的方法来映射实体与值类型？这样做是为了让hibernate可以对值类型应用任何优化吗？最佳答案一个实体已
hibernate - Hibernate 连接表的标准
我正在使用 HibernateTemplate.findByCriteria 方法进行一些查询。现在我想在标准上创建一些 SQL 限制，比如 criteria.add(Restrictions.sql
hibernate - 从表中全选 hibernate
所以我有以下代码: Query query = session.createQuery("from Weather"); List list = query.list();
hibernate - 查看与 hibernate
如何使用Hibernate映射具有多个实体的 View ？问候，混沌最佳答案请参见Hibernate文档中第5.1.3节“类”，紧接在“Id”节之前: There is no differen
hibernate - 为什么需要传统的 Hibernate？
据我所知，Hibernate 有两种类型的实现 JPA的实现(2)(@Entity，@Table注解) 扩展到旧的(传统的) hibernate (没有 JPA)，使用 HSQL 查询，没有注释如果
hibernate - Hibernate 中的多图
我需要一个将条目存储为键值对的集合(因此我可以通过键查找值)，但我需要一个允许多个值使用 hibernate 共享同一个键的集合最佳答案一个键具有多个值的映射称为多映射 - 在 Apache 公共

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

hibernate - hibernate 全文搜索-按相关性排序结果