gpt4 book ai didi

java - 在 elasticsearch 中为 hinglish 创建自定义词干分析器

转载 作者:行者123 更新时间:2023-11-29 04:30:50 26 4
gpt4 key购买 nike

我是 elasticsearch 的新手。我想在 elasticsearch 中创建一个自定义分析器,带有自定义过滤器和自定义词干分析器。我知道 ElasticSearch 是建立在 lucene 之上的,在 lucene 中,自定义词干分析器支持。但是,我找不到任何示例,它显示了 lucene 中的自定义分析器/词干分析器实现以及在 elasticsearch 中的集成。

为糟糕的英语道歉。提前致谢。

Edit 1

我想要的是 Hinglish Stemmer,它将以下输入转换为给定的以下输出:-

  • Rama, Raam, Ram => ram
  • Sachin、Sacheen、Sachina、Sacheena、Sachhin => sachin
  • Kuldeep, Kooldeep, Kuldip, Kooldipa => kuldip

最佳答案

最后,经过几次小插曲,我终于能够创建 hinglish-stemmer 的实现。可通过以下链接获得:-

https://github.com/Mangu-Singh-Rajpurohit/hinglish-stemmer/

关于java - 在 elasticsearch 中为 hinglish 创建自定义词干分析器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43854611/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com