asp.net - 在ElasticSearch NEST中创建自定义标记生成器-6ren

asp.net - 在ElasticSearch NEST中创建自定义标记生成器

转载作者：行者123 更新时间：2023-12-03 00:35:23

25

4

我在以下ES 2.5中有一个自定义类:

Title
DataSources
Content

运行搜索很好，除了中间字段外-使用定界符“|”构建/索引。

ex: "|4|7|8|9|10|12|14|19|20|21|22|23|29|30"

我需要构建一个查询，该查询与所有字段中的某些匹配，并与DataSource字段中的至少一个数字匹配。

因此，总结一下我目前所拥有的:

    QueryBase query = new SimpleQueryStringQuery
    {
        //DefaultOperator = !operatorOR ? Operator.And : Operator.Or,
        Fields = LearnAboutFields.FULLTEXT,
        Analyzer = "standard",
        Query = searchWords.ToLower()
    };
    _boolQuery.Must = new QueryContainer[] {query};

那就是搜索词查询。

    foreach (var datasource in dataSources)
    {
        // Add DataSources with an OR
        queryContainer |= new WildcardQuery { Field = LearnAboutFields.DATASOURCE, Value = string.Format("*{0}*", datasource) };
    }
    // Add this Boolean Clause to our outer clause with an AND
    _boolQuery.Filter = new QueryContainer[] {queryContainer};
}

这是针对数据源查询的。可以有多个数据源。

它不起作用，并返回添加了过滤器查询的结果。我认为我需要对 token 生成器/分析器进行一些工作，但是我对ES的了解还不足以解决这一问题。

编辑:Per Val下面的评论我试图这样重新编码索引器:

        _elasticClientWrapper.CreateIndex(_DataSource, i => i
            .Mappings(ms => ms
                .Map<LearnAboutContent>(m => m
                    .Properties(p => p
                        .String(s => s.Name(lac => lac.DataSources)
                            .Analyzer("classic_tokenizer")
                            .SearchAnalyzer("standard")))))
            .Settings(s => s
                .Analysis(an => an.Analyzers(a => a.Custom("classic_tokenizer", ca => ca.Tokenizer("classic"))))));
        var indexResponse = _elasticClientWrapper.IndexMany(contentList);

它使用数据成功构建。但是查询仍然无法正常工作。

数据源的新查询:

        foreach (var datasource in dataSources)
        {
            // Add DataSources with an OR
            queryContainer |= new TermQuery {Field = LearnAboutFields.DATASOURCE, Value = datasource};
        }
        // Add this Boolean Clause to our outer clause with an AND
        _boolQuery.Must = new QueryContainer[] {queryContainer};

和JSON:

{"learnabout_index":{"aliases":{},"mappings":{"learnaboutcontent":{"properties":{"articleID":{"type":"string"},"content":{"type":"string"},"dataSources":{"type":"string","analyzer":"classic_tokenizer","search_analyzer":"standard"},"description":{"type":"string"},"fileName":{"type":"string"},"keywords":{"type":"string"},"linkURL":{"type":"string"},"title":{"type":"string"}}}},"settings":{"index":{"creation_date":"1483992041623","analysis":{"analyzer":{"classic_tokenizer":{"type":"custom","tokenizer":"classic"}}},"number_of_shards":"5","number_of_replicas":"1","uuid":"iZakEjBlRiGfNvaFn-yG-w","version":{"created":"2040099"}}},"warmers":{}}}

查询JSON请求:

{
  "size": 10000,
  "query": {
    "bool": {
      "must": [
        {
          "simple_query_string": {
            "fields": [
              "_all"
            ],
            "query": "\"housing\"",
            "analyzer": "standard"
          }
        }
      ],
      "filter": [
        {
          "terms": {
            "DataSources": [
              "1"
            ]
          }
        }
      ]
    }
  }
}

最佳答案

实现此目的的一种方法是创建一个带有classic tokenizer的自定义分析器，该分析器会将您的DataSources字段分解为组成它的数字，即，它将标记每个|字符上的字段。

因此，在创建索引时，需要添加此自定义分析器，然后在DataSources字段中使用它:

PUT my_index
{
  "settings": {
    "analysis": {
      "analyzer": {
        "number_analyzer": {
          "type": "custom",
          "tokenizer": "number_tokenizer"
        }
      },
      "tokenizer": {
        "number_tokenizer": {
          "type": "classic"
        }
      }
    }
  },
  "mappings": { 
    "my_type": {
      "properties": {
        "DataSources": {
          "type": "string",
          "analyzer": "number_analyzer",
          "search_analyzer": "standard"
        }
      }
    }
  }
}

结果，如果您为字符串 "|4|7|8|9|10|12|14|19|20|21|22|23|29|30"编制索引，则 DataSources字段将有效地包含以下 token 数组: [4, 7, 8, 9, 10, 12, 14, 191, 20, 21, 22, 23, 29, 30]
然后，您可以摆脱 WildcardQuery，而只需使用 TermsQuery即可:

terms = new TermsQuery {Field = LearnAboutFields.DATASOURCE, Terms = dataSources }
// Add this Boolean Clause to our outer clause with an AND
_boolQuery.Filter = new QueryContainer[] { terms };

关于asp.net - 在ElasticSearch NEST中创建自定义标记生成器，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/41481643/

25

4

0

文章推荐： regex - 如何在Powershell中使用此正则表达式字符串？

文章推荐： c - 嵌入式RTOS停止系统

文章推荐： Clojure 线程在映射评估之间休眠

文章推荐： matlab - 在Psychtoolbox Matlab中创建警报声音

asp.net - ASP.Net MVC 与经典 ASP 有何不同(不是 ASP.Net——原始 ASP)
我试图对 ASP.Net MVC 有一个高层次的理解，我开始意识到它看起来很像原始的 ASP 脚本。过去，我们将“模型”/业务逻辑代码组织到 VBScript 类或 VB COM 组件中。当然，现在
asp.net - ASP Repeater 前面的项目总数 asp
我已经搜索了一段时间，但似乎找不到答案。我想在我的旋转木马中显示一个计数器，左边是当前项目(工作)，左边是项目总数。我的代码:
asp.net - ASP/ASP.NET 短标记的名称
. 最佳答案 Scott Gu 称这些为代码块。这就是我的看法。 http://weblogs.asp.net/scottgu/archive/2010/04/06/new-lt-gt-syntax
asp.net - 我可以将 asp.net 4.0 与经典 asp 结合使用，还是可以将经典 asp 转换为 asp.net？
我有一个使用 Visual Studio 2010/.net 4/VB 制作的网站。我真的很喜欢我发现的 FAQ 系统的布局，因为它很简单，但它是经典的 asp。所以，显然，我不能包括我的母版页布局
asp.net - 为什么 ASP.NET ViewState 保留为 asp :dropdownlist but not an asp:table?
好吧，对于你们许多人来说，这个问题可能有一个非常明显的答案，但它让我难住了。我有一个 asp.net Web 表单，上面有两个控件(嗯，不止这两个，但我们将重点关注这些) - 第一个是 asp:dr
asp.net - asp :UpdatePanel with an ASP. NET 复选框触发器
当我将 ASP.NET 复选框控件设置为 asp.net 更新面板的异步回发触发器时，EventName 属性是什么？最佳答案我相信它是 CheckedChanged。关于asp.net - a
asp.net - 结合经典的 asp 和 asp.net
我有一个用经典 asp 编写的(巨大的)网站。现在我必须切换到 vb.net (razor)。有没有办法将这两个结合起来直到切换完成？有没有办法让应用程序与经典的 asp 和 vb.net 一起工作
asp.net - ASP.NET 页面中的各种 asp 控件
I am creating a products page, where the user selects an option in a radiobuttonlist for example, an
asp.net - 哪个性能最好 : Classic ASP, ASP.NET WebForms 或 ASP.NET MVC？
我最近将一个经典的 ASP 应用程序转换为 ASP.NET 3.5，但我觉得我的经典 ASP 版本要快一些(我不知道可能买家会后悔)。所以你们能帮我解决这个问题吗，让我知道哪个更快，asp、asp.
asp.net - 我无法准确理解 ASP 是什么以及如何上传 ASP 网站
从本周开始，我被要求开始学习如何使用 ASP 开发网站。我通过 XNA 对 C# 有一定的经验，所以这部分对我来说并不是什么麻烦。我一直在关注Music Store Tutorial这需要我设置一个
asp.net - 新项目如何从 ASP.Net 转向经典 ASP
关闭。这个问题需要多问focused 。目前不接受答案。想要改进此问题吗？更新问题，使其仅关注一个问题 editing this post . 已关闭 8 年前。 Improve this ques
asp.net - 如何将页面从 ASP.NET 发布到经典 ASP
我想将一些表单变量发布到经典 ASP 页面中。我不想改变经典的 ASP 页面，因为需要完成大量的工作，以及消耗它们的页面数量。经典的 ASP 页面需要将表单变量 Username 和 Userpas
asp.net - 有什么好的引用资料或工具可用于将 ASP 转换为 ASP.NET？
已结束。此问题正在寻求书籍、工具、软件库等的推荐。它不满足Stack Overflow guidelines 。目前不接受答案。我们不允许提出寻求书籍、工具、软件库等推荐的问题。您可以编辑问题，以便
asp.net - ASP.NET/ASP.NET MVC中类似SSI的功能
在某种程度上，这可能是一个异端问题。我们有一个大型站点，其中许多页面仍在ASP中。通常，并没有真正动态的，而是包括(通过SSI或Server.Execute)定期重新生成的HTML块。看起来好像是一个
asp.net - asp 和 asp.net 之间的区别
关闭。这个问题需要多问focused 。目前不接受答案。想要改进此问题吗？更新问题，使其仅关注一个问题 editing this post . 已关闭 9 年前。 Improve this ques
asp.net - ASP --> ASP.Net : Refactoring steps
我有一个遗留的 ASP 应用程序——在不久的某个时候——需要迁移到 ASP.Net 2.0(以与也在 2.0 中的其他应用程序兼容)。对于这类事情是否有最佳实践，即作为第一步将当前 html、vbs
asp.net - 将经典 ASP 和 ASP.NET Web 窗体转换为 ASP.NET MVC
我目前在一家公司工作，该公司使用 ASP.NET Webforms 和旧 ASP 页面的组合进行 Web 开发。这对于他们当前的项目来说效果很好，但我想说服/建议他们切换到 ASP.NET MVC，因
asp.net - 将表单从 asp 发布到 asp.Net
我有一个经典的 asp 应用程序。我想将该页面的竞赛表格发布到 Asp.Net 表格。原因是我想在进入数据库之前使用我在 Asp.Net 页面中内置的大量逻辑进行验证，而我对 asp 不太了解。更不用
asp.net - ASP.NET 移动 View 是否仅适用于 ASP.NET MVC？或者它们也可以在普通的 ASP.NET 中使用？
我知道在 ASP.NET MVC 中，您可以拥有移动 View 并执行类似 Index.mobile.cshtml 的操作。和 _Layout.mobile.cshtml并且服务器知道将这些 View
asp.net - 从 C# ASP.Net 调用经典 ASP
我需要从一些服务器端 c#.net 代码中调用经典 asp 页面上的 VBscript 函数 - 有谁知道一种干净的方法来做到这一点？在 .net 中重写函数不是一种选择。我会再解释一下这个问题..

首页

博学

6Ren·AI

商城

asp.net - 在ElasticSearch NEST中创建自定义标记生成器