gpt4 book ai didi

elasticsearch - 如何在索引时停止在内容中存储特殊字符

转载 作者:行者123 更新时间:2023-12-02 22:34:10 25 4
gpt4 key购买 nike

这是一个示例文档,具有以下几点:
制药业
营销学
建筑物–
责任。
马萨诸塞州-2020年8月13日-
索引时如何从内容中删除特殊字符或非ASCII Unicode字符?我正在使用ES 7.x和Storm Crawler 1.17

最佳答案

看起来像是对字符集的错误检测。您可以在编写索引之前通过写一个custom parse filter来规范化内容,并删除那里不需要的字符。

关于elasticsearch - 如何在索引时停止在内容中存储特殊字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/64384571/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com