elasticsearch - 是否有 Elasticsearch 的词干分析器可以将 "broken"更改为 "break"-6ren

elasticsearch - 是否有 Elasticsearch 的词干分析器可以将 "broken"更改为 "break"

转载作者：行者123 更新时间：2023-12-03 00:59:03

24

4

这是我希望词干分析器执行的操作:
破:破
破:破
破:破
输入:输入
输入:输入
输入:输入

我已按如下方式对该字段进行了索引:
“ body ”: {
“类型”:“文本”，
“字段”:{
“词干提取”:{
“类型”:“文本”，
“分析器”:“英语”
}
}
}

当我查询“break and enter”时，我可以看到在 body.stemmed 字段中搜索的是:“break and enter”。看起来不错。
但是，当我查询“broke and enter”时，我得到:“broke and enter”。因此，显然，当使用“english”词干分析器时，“broke”不会变成“break”。
同样，“破而入”变成:“破而入”。因此，ES 显然不会将“损坏”或“损坏”更改为“中断”(根据此:snowball，我想解释了为什么如果这是使用的)。

那么，有没有办法指定一个“已知”的词干分析器来完成我想要做的事情？

最佳答案

您的要求可以通过 Dictionary Stemmer 来满足，它对词干进行字典查找。算法词干分析器在不了解词根的情况下进行词干提取，他们只是通过算法进行操作。
看看 Hunspell 词干分析器，认为它会完成这项工作:
https://www.elastic.co/guide/en/elasticsearch/guide/current/hunspell.html

关于elasticsearch - 是否有 Elasticsearch 的词干分析器可以将 "broken"更改为 "break"，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/40431071/

24

4

0

文章推荐： flash - 在Flash SWF中播放YouTube视频

文章推荐： powershell - 一行输出到txt和cvs

文章推荐： c# - 从1.x升级后，在Nest/Elastic Search 2.x中创建索引

详解dedecms后台编辑器将回车改为的方法
CFSDN坚持开源创造价值，我们致力于搭建一个资源共享平台，让每一个IT人在这里找到属于你的精彩世界. 这篇CFSDN的博客文章详解dedecms后台编辑器将回车改为的方法由作者收集整理，如果你对
javascript - 如何将改为
？
关闭。此题需要details or clarity 。目前不接受答案。想要改进这个问题吗？通过 editing this post 添加详细信息并澄清问题. 已关闭 6 年前。 Improve th
javascript - 改为 JS 文件中的谷歌分析？
不是将代码放在正文的头部或末尾(我把它放在正文的末尾)，如果我将代码放在 JS 文件中而不是在 html 中它自己的脚本标记，是否可以？ (我假设它像任何其他代码一样工作正常，但我问以防万一) 最佳答
postgresql - PSQL 命令行结束从 => 改为 (>
我尝试执行从\e 命令编写的查询，但现在我无法执行任何查询，但可以在 PSQL 中执行命令。现在我注意到这一点，我输入的命令现在在\e 中。当我关闭\e(尝试运行它)时问题开始了。最佳答案 ps
Java字符串替换(去掉换行符，将$改为\$)
我有一个这样的字符串($ 字符总是被其他字符包围): a$b c$d e$f 我希望我的字符串方法在 $ 前面放置一个 \ 并删除换行符: a\$bc\$de\$f 我试过了，但它没有放入 \ 字符:
java - 如何防止Java将XML文件中的 "&"改为 "&"
我需要使用 Java 构建一个 XML 文件。问题是我必须使用一些特殊字符，例如“ć”，然后在我的移动应用程序中读取它。如果我手动更改 ć 就可以正常工作至 ć在我的 XML 文件中的记事
javascript - 将改为 useMutation
我有一个removeUser 页面，我在其中使用，然后使用submitForm() 函数进行错误处理。这段代码运行得非常好: export default function RemoveUserPag
mysql - SQL查询将前面两个数字从 "2048"改为 "1948"
我在数据库 “2048-05-21” 中有一个看起来像这样的日期我只想得到年份，在这一年我只想得到两个后面的数字并将两个前面的数字更改为19 example: data : 2048-05-21 1
JAVA- 将 111 改为 123
public class Venus1 { public static void main(String args[]) { int[]x={1,2,3};
javascript - 改为 JavaScript 的 array_count_values
我有以下 PHP 脚本，现在我需要在 JavaScript 中做同样的事情。 JavaScript 中是否有类似于 PHP 函数的函数，我已经搜索了好几天但找不到类似的东西？我想做的是计算某个单词在数
c++ - #define 改为 constexpr auto
这个问题在这里已经有了答案: Is it bad practice to specify an array size using a variable instead of `#define` in
android - 如何将列表中的所有复选框 'check' 改为 'check' 单个复选框？
我陷入了一种情况，我必须通过“选中”工具栏中的复选框来“选中”列表中存在的所有复选框。这是创建复选框列表的代码:- itemTpl: 'checked="checked" /> {groupName
python - Python 改为 UTF-8 后出现奇怪的字符
我正在使用Python3。在分析一些网站时，我遇到了一些奇怪的字符并寻找解决方案。我找到了一个，但在找到解决方案之前，我尝试了一些方法，并且知道我无法重置它。当我使用 Jupyter 笔记本将列表 l
unity-game-engine - UnityWebRequest 改为 https
我在 http 下有 unity android app 和 site api 的工作基础设施。最近换了服务器，申请了ssl证书。现在我的 api 在 https 下。在 unity 应用程序中，
unity-game-engine - UnityWebRequest 改为 https
我在 http 下有 unity android app 和 site api 的工作基础设施。最近换了服务器，申请了ssl证书。现在我的 api 在 https 下。在 unity 应用程序中，
ios - objective-C 。 NSString 改为 NSCFNumber
我在 Objective-C 中有一些代码。我想，我收到了 NSString 类型，但是当我尝试将它保存在核心数据中时，我得到了一个 user.clientID = clientID; 错误，例如:
php - 将 Varchar 改为 Time 类型
在表中我有一个名为 CallTime 的字段 (Varchar)。包括晚上8:00、晚上8:40、上午10:00等时间我想将字段类型更改为“时间”并更新时间格式。该怎么做？谢谢最佳答案 UPD
c# - 为什么将 int 改为 long 会加快执行速度？
这个问题在这里已经有了答案: C# - for Loop Freezes at strange intervals (3 个答案) 关闭 6 年前。我试图解决 problem #14 from P
list - 预期为 'collections.Iterable' ，改为 Optional[list]
我今天在 Pycharm 社区版 5.0.3 中收到了这个错误，想知道这是否只是我做错了/没有意识到，或者是 PyCharm lint 问题。重现错误的代码是 mylist = list() # fi
java - 如何在页面上显示实体？改为 [Entity of type ... with id : 1]
我的目标是将数据库中的随机文本显示到网页上。首先，我不知道为什么我的数据没有保存，为什么我得到的是[Entity of type sec.helloweb.HelloMessage with id:

首页

博学

6Ren·AI

商城

elasticsearch - 是否有 Elasticsearch 的词干分析器可以将 "broken"更改为 "break"