gpt4 book ai didi

elasticsearch - Elasticsearch:自定义 token 过滤器

转载 作者:行者123 更新时间:2023-12-02 23:07:05 24 4
gpt4 key购买 nike

由于没有关于该主题的文档,因此了解如何从头开始在Java中实现自定义 token 过滤器插件非常复杂。
我想获得一个分析器过滤器,该过滤器仅返回例如数字的 token 。
任何的想法?

最佳答案

现有的过滤器可以执行此操作。例如, keep_types token filter可以做到这一点。
如果您使用<NUM>类型,则自定义 token 过滤器将仅允许数字 token 通过并过滤掉所有其他 token 。

GET _analyze
{
"tokenizer": "standard",
"filter": [
{
"type": "keep_types",
"types": [ "<NUM>" ]
}
],
"text": "1 quick fox 2 lazy dogs"
}
结果:
[1, 2]
您也可以使用 pattern_capture token filter获得类似的结果。
但是,如果您真的想采用Java方式,那么最好的方法是克隆一个 existing analysis plugin并自己滚动。

关于elasticsearch - Elasticsearch:自定义 token 过滤器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/64472450/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com