gpt4 book ai didi

php - 生成有错误的词(汽车品牌/型号)

转载 作者:行者123 更新时间:2023-11-29 06:46:45 25 4
gpt4 key购买 nike

我正在开发一种模糊搜索机制。我在数据库(mysql)(英文和俄文名称)中有汽车品牌/型号和城市 - 大约 1000 项。用户可以输入错误或翻译中的单词。现在我从 db 中检索所有这些单词,并将循环中的每个单词与用户输入的单词进行比较(使用 livenstein 距离和其他函数)。有什么方法可以生成每个单词(汽车品牌/型号)+错误单词的多种形式,因为我想从数据库中检索这些单词(使用类似 sql 运算符)。例如:我有汽车品牌:Toyota,我想生成 - Tokota、Tobota、Toyoba、Tayota、Тойота、Токота、Тобота(俄语)——每个词的许多形式。用户可以输入任何这个词,我可以发现他指的是 Toyota。

最佳答案

嗯,在 MySQL 中有一个名为 SOUNDEX 的函数。我不知道这是你需要的。例如:

SELECT SOUNDEX('Toyyota') == SOUNDEX('Toyota')

这是来自 MySQL 文档

Returns a soundex string from str. Two strings that sound almost the same should have identical soundex strings. A standard soundex string is four characters long, but the SOUNDEX() function returns an arbitrarily long string. You can use SUBSTRING() on the result to get a standard soundex string. All nonalphabetic characters in str are ignored. All international alphabetic characters outside the A-Z range are treated as vowels.

This function, as currently implemented, is intended to work well with strings that are in the English language only. Strings in other languages may not produce reliable results.

引用:http://dev.mysql.com/doc/refman/5.0/en/string-functions.html#function_soundex

关于php - 生成有错误的词(汽车品牌/型号),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18296021/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com