gpt4 book ai didi

zend-framework - Zend Lucene - 标记瑞典字符

转载 作者:行者123 更新时间:2023-12-05 00:07:37 25 4
gpt4 key购买 nike

我使用 Zend Lucene 来索引瑞典语文本。问题是 lucene 在瑞典字符 åäö 处标记单词。例如,单词“världens”在索引中变成了两个单词“v”和“ldens”。

有没有办法添加 zend lucene 应该接受而不是标记的字符?

最佳答案

使用 UTF-8 compatible text analyzer而不是 default text analyzer用于标记化。请注意,这需要 PHP 的 PCRE (Perl 兼容的正则表达式)库要编译为 UTF-8 支持(如果您使用与 PHP 捆绑的 PCRE 库,则为默认值,但如果您使用共享库,则可能不会启用)。对于不区分大小写的 UTF-8 兼容分析器版本,您还需要启用 mbstring 扩展。

关于zend-framework - Zend Lucene - 标记瑞典字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1980393/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com