- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我创建了一个公司类型。在该公司类型内部,我有一个名为“摘要”的字段。如何向该字段添加多个索引分析器?
我简要研究过使用 Yakaz 插件,但似乎我无法将其与 NEST 一起使用。
其背后的原因是,有时用户会在查询中搜索带有句点的公司名称,有时他们不会包含句点。我想使用 ngrams 对带标点符号和不带标点符号的公司名称进行部分匹配。我目前正在使用停用词过滤器来删除标点符号。
摘要字段的属性(有多个索引分析器会引发错误):
[ElasticProperty(IndexAnalyzer = "partial_match", IndexAnalyzer = "partial_match_no_punctuation", SearchAnalyzer = "full_match")]
public string Summary { get; set; }
映射:
private static void CreateMapping(ElasticClient client)
{
var partialMatchNoPunctuation = new CustomAnalyzer
{
Filter = new List<string> { "standard", "lowercase", "asciifolding", "punctuation_filter", "name_ngrams" }, //Apply all filters before ngram
Tokenizer = "standard"
};
var partialMatch = new CustomAnalyzer
{
Filter = new List<string> { "standard", "lowercase", "asciifolding", "name_ngrams" }, //Apply all filters before ngram
Tokenizer = "standard"
};
var fullMatch = new CustomAnalyzer
{
Filter = new List<string> { "standard", "lowercase", "asciifolding" },
Tokenizer = "standard"
};
client.CreateIndex(Settings.Default.IndexName, c => c
.Analysis(descriptor => descriptor
.TokenFilters(bases => bases
.Add("name_ngrams", new NgramTokenFilter
{
MaxGram = 11,
MinGram = 3
})
.Add("punctuation_filter", new StopTokenFilter
{
Stopwords = new List<string> {"."}
})
)
.Analyzers(bases => bases
.Add("partial_match", partialMatch)
.Add("partial_match_no_punctuation", partialMatchNoPunctuation)
.Add("full_match", fullMatch))
)
);
}
或者,如果有一种方法可以在单个分析器中执行此操作,我愿意接受建议。
编辑:
我的类名称是“ElasticSearchProject”。我希望将其存储为名为“Project”的类型。我相信我的尝试是导致错误的原因。当我获取类型 Project 的映射时,它仅应用了部分匹配分析器。
这是唯一仍然适用于我的类的 ES 属性:
[ElasticType(Name = "Project")]
多字段映射:
.AddMapping<ElasticSearchProject>(m => m
.MapFromAttributes()
.Properties(project=>project
.MultiField(mf=>mf
.Name("Project")
.Fields(f=>f
.Number(s=>s.Name(o=>o.Id).Index(NonStringIndexOption.no))
.String(s => s.Name(o => o.Summary).IndexAnalyzer("partial_match"))
.String(s => s.Name(o => o.Summary).IndexAnalyzer("partial_match_no_punctuation"))
))))
最佳答案
首先,回答您的问题,您不能将多个分析器添加到单个字段。但是,您可以使用 multi field type 来映射同一字段的多个版本,并对每个版本应用不同的分析器。看看这个answer了解如何使用 NEST 实现此目的。
关于带标点符号和不带标点符号的搜索,如果您使用与索引和搜索分析器相同的分析器,那么这并不重要,因为在索引期间应用于字段的相同分析也将应用于用户查询。
示例:
Foo.Bar
将被索引为 foobar
。
如果用户搜索 Foo.Bar
或 FooBar
,搜索分析器会将其转换为 foobar
,并且会找到匹配项因为该字段也被索引为 foobar
。
我认为您的部分问题是您尝试使用 full_match
作为搜索分析器,并使用 partial_match_no_punctuation
和 partial_match
作为索引分析仪。尝试将它们整合为一个(删除标点符号、ngram),并将其用于您的搜索和索引分析器。如果您发现仍然需要多个分析器,请查看我上面提到的多字段类型。
希望有帮助。
编辑:根据您的更新,多字段映射的问题是您尝试为两个字段分配相同的名称。此外,您将字段命名为“project”,这是您的类型的名称,您可能想将其命名为“summary”。此外,您不希望将 Id 字段包含在摘要多重字段中。试试这个:
.AddMapping<ElasticSearchProject>(m => m
.MapFromAttributes()
.Properties(project => project
.MultiField(mf => mf
.Name(o => o.Summary)
.Fields(f => f
.String(s => s.Name(o => o.Summary).Analyzer("partial_match"))
.String(s => s.Name(o => o.Summary.Suffix("no_punctuation")).Analyzer("partial_match_no_punctuation"))
)))));
这将在您的映射中创建两个字段:
使用partial_match
分析器进行
summary
。
summary.no_puncuation
与 partial_match_no_punctuation
分析器。
关于elasticsearch - 如何在NEST中使用多个索引分析器?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24120960/
在查看Thermostat Guide时,我没有提到湿度读数。这些数据可以通过API获得吗?会在以后的版本中吗? 最佳答案 从NestAPI v1.1开始,似乎湿度数据可以作为只读字段使用。 可以在v
我从以下位置获取了授权码 https://home.nest.com/login/oauth2?client_id=CLIENT_ID&state=FOO . 我想获取access_token,但是出
使用1.1.2版本的Nest,似乎至少有3种索引多个文档的方法: IndexMany client.IndexMany(documents, "index_name", "type_name"); 使
我有2个POJO(人和车),其中一个由另一个人引用 @Document(indexName = "person", type = "user") public class Person { @
Nest Protect(烟雾和一氧化碳警报)可以测量温度和湿度,但官方或非官方 API 似乎都不允许访问这些数据。有人在工作吗?任何视线访问这些数据?建议?谢谢! 最佳答案 $infos = (o
自从我得到 Nest 以来,我所想要的就是能够在很长一段时间内汇总我的能量使用情况以寻找模式,主要是满足我的好奇心。当然有每月使用报告,而且网络和设备只能追溯到 10 天。 API 是否公开了这些数据
我在获取和更改 Nest 恒温器提供的一些基本数据时遇到了问题。 使用命令行,我如何获取或更改恒温器上的个别设置或值? 最佳答案 这是几个用户的汇编,解释了如何检索或更改一些基本信息,并添加了我自己的
我和我的一位同事就以下最佳实践问题进行了讨论。 大多数函数/方法都从一些参数检查开始。 我提倡以下风格,避免嵌套。 if (parameter one is ugly) return ERROR; i
我有 4 个表: ChatRooms Participants Messages Users 聊天室有很多参与者 聊天室有很多消息 用户有很多消息 用户有很多参与者 参与者属于用户 消息属于用户 我正
我编写了以下函数并得到如下所示的响应: public async Task ShowMapping(string indexname) { var resu
我正在使用 NEST 为我的对象编制索引,但在序列化时遇到了 Newtonsoft 错误。我的一个对象有一个自引用循环。有没有一种方法可以让我访问 JsonSerializer 并更改它处理自引用的方
设置目标温度会引发如下错误。我正在使用 php curl 来设置温度。任何帮助表示赞赏。 object(stdClass)#72 (2) { ["cmd"]=> stri
我编写了以下函数并得到如下所示的响应: public async Task ShowMapping(string indexname) { var resu
我正在使用 Nest Developer https://developer.nest.com/用于创建 iOS 应用程序的 API。有谁知道如何将 Firebase 框架链接到我的应用程序中?我不断
我是名为 Feather (featherapp.co) 的综合性 Apple TV 应用程序的开发者。我遇到的一个问题是用户希望能够查看他们相机的实时画面。 有没有人确定访问摄像头实时画面的方法?我
免责声明 - 我担心这个问题可能是重复的,因为功能看起来很基本,所以我知道我可能会得到一个骗局。但我找不到有效的解决方案 所以我有一个可观察的数组设置如下 self.meetingAttendees
我正试着给我的模块提供一个令牌。该模块如下所示:。我将AuthGuardModule导入到的父模块如下所示:。而gardConfigProvider本身如下所示:。但我得到一个错误:Error[Exc
我正试着给我的模块提供一个令牌。该模块如下所示:。我将AuthGuardModule导入到的父模块如下所示:。而gardConfigProvider本身如下所示:。但我得到一个错误:Error[Exc
每 10 秒使用一次访问 token 时遇到太多请求错误。在重新阅读文档时,我意识到这是一个禁忌(“为了避免错误,我们建议您以每分钟一次或更短的速度提出请求”)。 有谁知道我会被限制多久? 最佳答案
我使用嵌套 plist 来创建对象结构(CLOS 类型),将嵌套的对象传递给它的部分。我想以迭代方式 append 嵌套的 plist,但因此我想在时间和内存方面高效地完成它。 以下示例显示了由于一次
我是一名优秀的程序员,十分优秀!