- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
已更新以显示工作示例
我正在尝试对 ElasticSearch 中的一组用户名进行部分搜索。
四处搜索为我指明了 nGram Tokenizer
的方向,但我在正确实现方面遇到困难,未能获得任何结果。
这是从我正在处理的项目中剥离的相关代码。
我尝试了不同的组合和搜索类型,但均无济于事。
setup.cs
var client = new ElasticClient(settings.ConnectionSettings);
// (Try and) Setup the nGram tokenizer.
var indexSettings = new IndexSettings();
var custonAnalyzer = new CustomAnalyzer();
customAnalyzer.Tokenizer = "mynGram";
customAnalyzer.Filter = new List<string> { "lowercase" };
indexSettings.Analysis.Analyzers.Add("mynGram", customAnalyzer);
indexSettings.Analysis.Tokenizers.Add("mynGram", new NGramTokenizer
{
MaxGram = 10,
MinGram = 2
});
client.CreateIndex(settings.ConnectionSettings.DefaultIndex, indexSettings);
client.MapFromAttributes<Profile>();
// Create and add a new profile object.
var profile = new Profile
{
Id = "1",
Username = "Russell"
};
client.IndexAsync(profile);
// Do search for object
var s = new SearchDescriptor<Profile>().Query(t => t.Term(c => c.Username, "russ"));
var results = client.Search<Profile>(s);
Profile.cs
public class Profile
{
public string Id { get; set; }
[ElasticProperty(IndexAnalyzer = "mynGram")]
public string Username { get; set; }
}
如有任何提示,我们将不胜感激。
最佳答案
看看这个来自 the es docs on nGram token filters :
"settings" : {
"analysis" : {
"analyzer" : {
"my_ngram_analyzer" : {
"tokenizer" : "my_ngram_tokenizer"
}
},
"tokenizer" : {
"my_ngram_tokenizer" : {
"type" : "nGram",
"min_gram" : "2",
"max_gram" : "3",
"token_chars": [ "letter", "digit" ]
}
}
}
}
注意事项
您需要将mynGram
添加到您的分析器中,否则它不会被使用。他们的工作方式是这样的。每个索引字段都有一个应用于它的分析器,一个分析器是一个标记器,后跟零个或多个标记过滤器。您已经定义了一个很好的 nGram 分词器 (mynGram
) 来使用,但是您没有在 customAnalyzer
中使用它,它使用的是 standard
分词器。 (基本上你只是定义但从未使用 mynGram
。)
您需要告诉 elasticsearch 在您的映射中使用您的 customAnalyzer
:"properties": {"string_field": {"type": "string", "index_analyzer": customAnalyzer"}}
您应该将 maxGram
更改为更大的数字(可能是 10),否则 4 个字母的搜索将不会像自动完成一样准确地运行(或者可能什么都不返回,取决于搜索时间分析器).
使用 _analyze
api 端点来测试您的分析器。这应该行得通。
curl -XGET ' http://yourserver.com:9200?index_name/_analyze?analyzer=customAnalyzer ' -d 'rlewis'
祝你好运!
关于c# - 指定 NGramTokenizer 并将其与用于 Elastic Search 的 C# NEST 客户端一起使用,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17960966/
在查看Thermostat Guide时,我没有提到湿度读数。这些数据可以通过API获得吗?会在以后的版本中吗? 最佳答案 从NestAPI v1.1开始,似乎湿度数据可以作为只读字段使用。 可以在v
我从以下位置获取了授权码 https://home.nest.com/login/oauth2?client_id=CLIENT_ID&state=FOO . 我想获取access_token,但是出
使用1.1.2版本的Nest,似乎至少有3种索引多个文档的方法: IndexMany client.IndexMany(documents, "index_name", "type_name"); 使
我有2个POJO(人和车),其中一个由另一个人引用 @Document(indexName = "person", type = "user") public class Person { @
Nest Protect(烟雾和一氧化碳警报)可以测量温度和湿度,但官方或非官方 API 似乎都不允许访问这些数据。有人在工作吗?任何视线访问这些数据?建议?谢谢! 最佳答案 $infos = (o
自从我得到 Nest 以来,我所想要的就是能够在很长一段时间内汇总我的能量使用情况以寻找模式,主要是满足我的好奇心。当然有每月使用报告,而且网络和设备只能追溯到 10 天。 API 是否公开了这些数据
我在获取和更改 Nest 恒温器提供的一些基本数据时遇到了问题。 使用命令行,我如何获取或更改恒温器上的个别设置或值? 最佳答案 这是几个用户的汇编,解释了如何检索或更改一些基本信息,并添加了我自己的
我和我的一位同事就以下最佳实践问题进行了讨论。 大多数函数/方法都从一些参数检查开始。 我提倡以下风格,避免嵌套。 if (parameter one is ugly) return ERROR; i
我有 4 个表: ChatRooms Participants Messages Users 聊天室有很多参与者 聊天室有很多消息 用户有很多消息 用户有很多参与者 参与者属于用户 消息属于用户 我正
我编写了以下函数并得到如下所示的响应: public async Task ShowMapping(string indexname) { var resu
我正在使用 NEST 为我的对象编制索引,但在序列化时遇到了 Newtonsoft 错误。我的一个对象有一个自引用循环。有没有一种方法可以让我访问 JsonSerializer 并更改它处理自引用的方
设置目标温度会引发如下错误。我正在使用 php curl 来设置温度。任何帮助表示赞赏。 object(stdClass)#72 (2) { ["cmd"]=> stri
我编写了以下函数并得到如下所示的响应: public async Task ShowMapping(string indexname) { var resu
我正在使用 Nest Developer https://developer.nest.com/用于创建 iOS 应用程序的 API。有谁知道如何将 Firebase 框架链接到我的应用程序中?我不断
我是名为 Feather (featherapp.co) 的综合性 Apple TV 应用程序的开发者。我遇到的一个问题是用户希望能够查看他们相机的实时画面。 有没有人确定访问摄像头实时画面的方法?我
免责声明 - 我担心这个问题可能是重复的,因为功能看起来很基本,所以我知道我可能会得到一个骗局。但我找不到有效的解决方案 所以我有一个可观察的数组设置如下 self.meetingAttendees
我正试着给我的模块提供一个令牌。该模块如下所示:。我将AuthGuardModule导入到的父模块如下所示:。而gardConfigProvider本身如下所示:。但我得到一个错误:Error[Exc
我正试着给我的模块提供一个令牌。该模块如下所示:。我将AuthGuardModule导入到的父模块如下所示:。而gardConfigProvider本身如下所示:。但我得到一个错误:Error[Exc
每 10 秒使用一次访问 token 时遇到太多请求错误。在重新阅读文档时,我意识到这是一个禁忌(“为了避免错误,我们建议您以每分钟一次或更短的速度提出请求”)。 有谁知道我会被限制多久? 最佳答案
我使用嵌套 plist 来创建对象结构(CLOS 类型),将嵌套的对象传递给它的部分。我想以迭代方式 append 嵌套的 plist,但因此我想在时间和内存方面高效地完成它。 以下示例显示了由于一次
我是一名优秀的程序员,十分优秀!