gpt4 book ai didi

mysql - Sphinx - 分隔符

转载 作者:行者123 更新时间:2023-11-29 03:13:26 28 4
gpt4 key购买 nike

我想知道 Sphinx 引擎是否可以使用任何定界符(如普通 MySQL 中的逗号和句点)。我的问题来自于一种冲动,根本不使用它们,而是逃避它们,或者至少在使用 FULLTEXT 搜索执行 MATCH 操作时它们不会发生冲突,因为默认情况下我在 MySQL 中处理它们时遇到问题而且我不希望被迫用任何其他字符替换这些分隔符以提供一组好的结果。

抱歉,如果我说了一些愚蠢的话,但我没有使用 Sphinx 或其他补充(?)搜索引擎的经验。

举个例子,如果我执行搜索

"Passat 2.0 TDI"

默认情况下,MySQL 会将这种情况下的句点识别为分隔符,并且由于“2”和“0”太短而不能默认被视为单词,因此结果会有点困惑。

使用 Sphinx(或其他搜索引擎)是否容易处理?我愿意接受建议。

这是一个大型项目,可能有超过 500.000 条记录(一点也不小)。

干杯!

最佳答案

您可以通过指定 charset table 来有效地控制哪些字符是分隔符具体的 sphinx index .

如果您从字符集表中排除一个字符,它实际上充当分隔符。如果您在字符集表中指定它(甚至是 U+0020 的空格),它将不再充当分隔符,而是您的标记字符串的一部分。

为了灵 active ,每个索引(使用一个或多个 sphinx data sources)可以有不同的字符集表。

注意:如果您想要单字符词,您可以指定min_word_len每个 sphinx 索引。

关于mysql - Sphinx - 分隔符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4464384/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com