gpt4 book ai didi

elasticsearch - Elasticsearch在双引号之外标记化

转载 作者:行者123 更新时间:2023-12-02 23:48:02 25 4
gpt4 key购买 nike

我有一个用下面创建的映射的elasticsearch。

PUT /test
{
"settings":{
"analysis":{
"analyzer":{
"my_analyzer":{
"filter":[
"lowercase"
],
"type":"custom",
"tokenizer":"my_tokenizer"
}
},
"tokenizer": {
"my_tokenizer": {
"type": "char_group",
"tokenize_on_chars": [
"whitespace",
":"
]
}
}
}
},
"mappings":{
"properties":{
"data":{
"type":"text",
"analyzer":"my_analyzer"
}
}
}
}

我想要做的是在遇到:字符时创建一个新 token ,并将其从数据中删除。但是我只想在双引号(“)之外使用它。有什么方法可以实现?

最佳答案

恕我直言,您可以尝试使用regexp和模式 token 生成器(https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-pattern-tokenizer.html)来表达它,也可以...亲自编写 token 生成器,然后尝试将其添加到您的Elasticsearch安装中。

关于elasticsearch - Elasticsearch在双引号之外标记化,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59775036/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com