gpt4 book ai didi

php - 带有单词列表和链接的 MYSQL 和 PHP 搜索脚本

转载 作者:行者123 更新时间:2023-11-30 23:29:50 26 4
gpt4 key购买 nike

我正在为我的网站制作搜索表单/脚本。

首先,我网站内容中使用的每个单词都存储在一个名为 words 的 MYSQL 表中,它看起来像这样:

id |  word | title_count | content_count | article_count | photo_count | video_count |
---+-------+-------------+---------------+---------------+-------------+-------------+
1 | hello | 3 | 1 | 0 | 1 | 0 |
2 | what | 1 | 4 | 1 | 0 | 0 |

wordid字段是UNIQUE,title_countcontent_count字段用来存储多少个该词在标题或主要内容中使用的时间。另一个 _count 字段只是说明该词在一篇文章/照片/视频中被使用了多少次。

我不确定所有这些计数字段是否对搜索功能有用,但我认为它可能会派上用场。

然后我有多个链接表到 words 表的所有 _count 字段,如下所示:

id |  word_id | 
---+----------+
43 | 2 |
7 | 1 |
7 | 2 |

这些表称为:word_link_titleword_link_contentword_link_articleword_link_photoword_link_video code> 等。id 字段存储链接到的文章/照片/视频的 id,word_id 存储链接单词的 ID。

既然我已经完成了所有这些设置,我有点卡住了。我真的不清楚如何根据所有这些数字和研究术语来整理相关内容。

我计划做的是一个包含多个选项卡的搜索结果页面,其中一个会显示所有搜索结果,然后在其他选项卡中,它将在文章/照片/视频中分开。

我不知道我是否真的走在正确的道路上,让一些东西发挥作用。希望有人能帮助我..

最佳答案

这完全取决于您想要什么,如果您想要建议结果,您可能需要研究一些著名的词搜索算法:Jaro-Winkler适合短词和Levenshtein适用于长文本中的短词。您还可以使用 PHP 的 similar_text 函数在这些先前的算法之后进行更好的匹配。

我发布了一堆搜索脚本here (Jaro-Winkler)和 here当我构建一个搜索引擎项目时,如果你想检查一下。

至于不同的计数,为什么不呢?您可以使用出现次数来支持某些关键字。但是要小心将哪些插入到数据库中!您不希望像“the”或“it”这样的词或任何其他常用词破坏所有这一切。

编辑:当然,这意味着搜索将在 PHP 中进行,并且需要从数据库中选择大量关键字(如果不是全部的话)会带来巨大的不便。我最终在包含超过 3000 个单词的数据库上估计的最大搜索时间为 0.04 秒。所以看起来还可以=)

关于php - 带有单词列表和链接的 MYSQL 和 PHP 搜索脚本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11321214/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com