gpt4 book ai didi

c# - Elasticsearch Nest 带空格的通配符查询

转载 作者:太空狗 更新时间:2023-10-30 01:34:43 25 4
gpt4 key购买 nike

简短版:

我想使用 Nest 编写一个 Elasticsearch 查询来获取已被索引的完整索引项(ContentIndexables 在我的例子中是我的自定义类型)。该查询受 [some string] + * 的术语查询(即 String.StartsWith() 其中 [some string] 可能包含也可能不包含空格。

这与 CompletionSuggester 不同,因为我需要检索完整的对象而不是字符串建议。

到目前为止我尝试了什么:

当我查询不带空格的文本时,使用以下代码返回所需的输出。但是,如果我的搜索词包含空格,则不会返回预期的结果。

这是我搜索字段的方式:

var searchResults = _client.Search<ContentIndexable>(
body =>
body
.Index(indexName)
.Query(
query =>
query.QueryString(
qs => qs.
OnFields(f => f.Title, f => f.TextContent)
.Query(searchTerm + "*"))));

这是一个演示如何重现问题的单元测试:

indexService.IndexUserItemsSync(testGuid, IndexType.submission, new ContentIndexable
{
ContentId = Guid.NewGuid(),
TextContent = "Some description",
Title = "title"
});

indexService.IndexUserItemsSync(testGuid, IndexType.submission, new ContentIndexable
{
ContentId = Guid.NewGuid(),
TextContent = "Some description",
Title = "title that is long"
});

indexService.IndexUserItemsSync(testGuid, IndexType.submission, new ContentIndexable
{
ContentId = Guid.NewGuid(),
TextContent = "Some description",
Title = "title that likes"
});

indexService.IndexUserItemsSync(testGuid, IndexType.submission, new ContentIndexable
{
ContentId = Guid.NewGuid(),
TextContent = "Some description",
Title = "titlethat"
});

var searchResult = indexService.SearchUserItems(testGuid, IndexType.submission, 10, "title");
Assert.IsNotNull(searchResult);
// this one works
Assert.AreEqual(4, searchResult.Count());

var searchResult2 = indexService.SearchUserItems(testGuid, IndexType.submission, 10, "title that");
Assert.IsNotNull(searchResult2);
// this one does not!!! searchREsult2.Count() evaluates to 0
Assert.AreEqual(2, searchResult2.Count());

如您所见,然后我输入“title that”,搜索结果为空,而不是我希望返回的两行。

更新:更多信息:我在我的类型 ContentIndexable 上创建了一个索引:

public class ContentIndexable : IIndexable
{
public Guid ContentId { get; set; }
public string Title { get; set; }
public string TextContent { get; set; }
}

使用此代码:

_client.CreateIndex(
indexName,
descriptor =>
descriptor.AddMapping<ContentIndexable>(
m => m.Properties(
p => p.Completion(s => s
.Name(n => n.Title)
.IndexAnalyzer("standard")
.SearchAnalyzer("standard")
.MaxInputLength(30)
.Payloads()
.PreserveSeparators()
.PreservePositionIncrements())
.Completion(s => s.Name(n => n.TextContent)
.IndexAnalyzer("standard")
.SearchAnalyzer("standard")
.MaxInputLength(50)
.Payloads()
.PreserveSeparators()
.PreservePositionIncrements())
)));

我什至在索引时或在使用 string.Replace("", @"\") 查询时都试图转义空格,但这没有帮助。

将搜索类型更改为通配符也无济于事:

var searchResults = _client.Search<ContentIndexable>(
body =>
body
.Index(indexName)
.Query(
query => query.Wildcard(qd => qd.OnField(f => f.Title).Value(searchTerm + "*"))));

有人知道我做错了什么吗?

请注意,我的 CompletionSuggester 版本适用于空格,但不幸的是只返回字符串。我需要取出完整项目 才能获取ContentId。我的 CompletionSuggester 实现:

public IEnumerable<string> GetAutoCompleteSuggestions(Guid userId, IndexType indexType, int size, string searchTerm)
{
string indexName = getIndexName(indexType, userId);

var result = _client.Search<ContentIndexable>(
body => body.Index(indexName)
.SuggestCompletion("content-suggest" + Guid.NewGuid(),
descriptor => descriptor
.OnField(t => t.Title)
.Text(searchTerm)
.Size(size)));

if (result.Suggest == null)
{
return new List<string>();
}

return (from suggest in result.Suggest
from value in suggest.Value
from options in value.Options
select options.Text).Take(size);
}

我知道我可以采纳这些建议,得到完整的值(这将产生我期待的两个项目),然后使用我的第一种方法进行完整的术语匹配,但这需要对 ElasticSearch 进行 2 次单独调用(一次用于完整的建议,第二个用于术语查询),但理想情况下,如果可能的话,我希望在没有往返的情况下进行。

非常感谢,

最佳答案

这是您如何处理 Title 字段问题的示例。

将您的映射更改为类似(或使用 MultiField ,但我找不到同时将字段映射为字符串和完成的选项):

client.CreateIndex(indexName, i => i
.AddMapping<ContentIndexable>(m => m
.Properties(
ps => ps
.Completion(c => c.Name("title.completion")
.IndexAnalyzer("standard")
.SearchAnalyzer("standard")
.MaxInputLength(30)
.Payloads()
.PreserveSeparators()
.PreservePositionIncrements())
.String(s => s.Name(x => x.Title).CopyTo("title.completion")))));

将您的 SuggestCompletion 更改为

var result = client.Search<ContentIndexable>(body => body
.Index(indexName)
.SuggestCompletion("content-suggest" + Guid.NewGuid(),
descriptor => descriptor
.OnField(t => t.Title.Suffix("completion"))
.Text("title")
.Size(10)));

QueryString

var searchResponse = client.Search<ContentIndexable>(body => body
.Index(indexName)
.Query(query => query
.QueryString(
qs => qs
.OnFields(f => f.Title.Suffix("completion"))
.Query("title tha" + "*")
.MinimumShouldMatchPercentage(100))));

此解决方案的问题在于我们为 Title 字段存储了两次数据。这就是为什么我之前提到使用 MultiField 会很棒但我无法使用 NEST 执行此操作。

希望这对您有所帮助。

关于c# - Elasticsearch Nest 带空格的通配符查询,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29728681/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com