gpt4 book ai didi

c# - 使用 NEST C# 客户端的 ElasticSearch 重音不敏感查询

转载 作者:太空宇宙 更新时间:2023-11-03 18:35:23 30 4
gpt4 key购买 nike

我正在尝试使用 NEST c# 客户端在 ElasticSearch 中进行查询,这是一个没有重音的查询,我的数据包含带有重音的葡萄牙拉丁语单词。请看下面的代码:

var result = client.Search<Book>(s => s
.From(0)
.Size(20)
.Fields(f => f.Title)
.FacetTerm(f => f.OnField(of => of.Genre))
.Query(q => q.QueryString(qs => qs.Query("sao")))
);

此搜索未找到任何内容。我在该索引上的数据包含许多标题,例如:“São Cristóvan”、“São Gonçalo”。

var settings = new IndexSettings();
settings.NumberOfReplicas = 1;
settings.NumberOfShards = 5;
settings.Analysis.Analyzers.Add("snowball", new Nest.SnowballAnalyzer { Language = "Portuguese" });
var idx5 = client.CreateIndex("idx5", settings);

如何使用 ElasticSearch 查询“sao”并找到“são”?

我认为必须创建具有正确属性的索引,但我已经尝试过很多设置,例如。

或原始模式:

    {     "idx" : {       "settings" : {         "index.analysis.filter.jus_stemmer.name" : "brazilian",         "index.analysis.filter.jus_stop._lang_" : "brazilian"       }     }    }

如何进行搜索并忽略重音符号?

谢谢 friend ,

最佳答案

查看解决方案:

使用 putty 执行连接到 elasticsearch 搜索:

curl -XPOST 'localhost:9200/idx30/_close'

curl -XPUT 'localhost:9200/idx30/_settings' -d '{
"index.analysis.analyzer.default.filter.0": "standard",
"index.analysis.analyzer.default.tokenizer": "standard",
"index.analysis.analyzer.default.filter.1": "lowercase",
"index.analysis.analyzer.default.filter.2": "stop",
"index.analysis.analyzer.default.filter.3": "asciifolding",
"index.number_of_replicas": "1"
}'

curl -XPOST 'localhost:9200/idx30/_open'

将“idx30”替换为您的索引名称

完成!

关于c# - 使用 NEST C# 客户端的 ElasticSearch 重音不敏感查询,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16342077/

30 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com