gpt4 book ai didi

elasticsearch - 多语言支持:现在还是以后添加所有语言映射?

转载 作者:行者123 更新时间:2023-12-03 00:19:07 24 4
gpt4 key购买 nike

我正在做一个Web应用程序,它使用Elasticsearch进行搜索并被设计为支持多种语言。在映射中,我有一些看起来像这样的字段:

"myfield": {"properties": {"en": {}, "zh_TW": {}, "ar": {}, ....}} 

但是,启动后,它将仅支持一种语言(英语)。对其他语言的支持将在以后添加,我们计划将来增加对多种语言的支持。

我是否应该现在在映射中添加所有可能的语言代码(例如“en”,“zh_TW”等)(显然,这是一个很长的列表)?还是仅在将语言引入系统后才添加语言代码?

对于第二种方法,额外的工作或运营影响是什么?我可以重新索引所有文件吗?我现在还必须知道什么?

感谢您的输入!

最佳答案

不必为文档重新编制索引就不用担心了,因为无论如何您都必须更新文档以添加新语言的内容,不是吗?

因此,在将第一个文本放入该语言之前,请为每种新支持的语言放置映射。

建议您为每种受支持的语言复制字段,例如:

"myfield_en" : ...,
"myfield_zh_TW" : ...,
"myfield_ar" : ...

因为放置映射更加容易。

当您开始支持(例如)德语时,请使用德语分析器为新字段 "myfield_de"映射。此后,每次您插入或更新具有德语翻译的文档时,都会分析“德语”字段。

如果您的文档没有德语翻译,则不需要重新索引。

结论:当您还没有任何文本可写时,为字段放置映射是毫无意义的。

关于elasticsearch - 多语言支持:现在还是以后添加所有语言映射?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33018080/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com