gpt4 book ai didi

mysql - 使用全文搜索从文本字段中提取特定单词

转载 作者:行者123 更新时间:2023-11-29 14:51:10 26 4
gpt4 key购买 nike

我的问题有点类似于Extract specific words from text field in mysql ,但现在还是一样。

我有一个文本字段,里面有文字。在我的语言中,单词可以有许多不同的结尾。我需要找到这个结局。

我使用mysql的全文搜索,但我需要访问索引数据库,其中所有字段都被“剪切”为单词并且单词被计数。然后我可以搜索“test*”,我可以很快找到“test”、“tested”、“testing”。我需要数据库中存在的所有端点的列表,这是我的主要目标。

事实上,我可以获得其中包含特定“test*”单词的记录,但我不仅需要找到该字段中的出现情况,还需要以某种方式进行分组,以便我获得所有单词的列表,例如从“测试”开始。我不需要它们所在记录的位置,只需一个列表,分组以便“测试”不会写入 10 次,而只写入一次(也许是找到它的次数的计数器,但不是必需的)。

有没有办法从全文搜索字段中提取此信息,或者我应该将所有这些字段分解为单词并制作一个充满单词的索引表,然后只执行“like“word%”并按不同的结果进行分组?我是不知道在实践中如何做到这一点,但请为我指出正确的方向。

总结一下:我有一个文本字段,我需要找出里面有哪些单词以“test”开头,例如“tested”、“test”、“testing”等...在英语中是有意义的,但在我的语言中却是这样,因为我们在不同的词尾上有相同的单词,而且有很多,有时有 20 个,我需要找出其中有哪些,这样我就可以制作一个同义词表;-)

更新:

数据库包含 ID (int)、成分 (text) 和配方 (text) 列。

配料中的数据是具有不同结尾的 cooking 配料,例如:

1个鸡蛋鸡蛋2个

等等

最佳答案

您可以转储索引中存在的所有单词。这也会显示每个单词的频率。例如。 test 使用了 200 次,testing 使用了 300 次。

手册:http://dev.mysql.com/doc/refman/5.0/en/myisam-ftdump.html

关于mysql - 使用全文搜索从文本字段中提取特定单词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5712729/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com