gpt4 book ai didi

python - MySQL存储和搜索文本

转载 作者:行者123 更新时间:2023-12-03 02:13:28 25 4
gpt4 key购买 nike

假设我们每个都有一页的3M文件。我想将所有文本导入MySQL数据库。对于我正在阅读的内容,我可以将其添加为文本字段(65535个字符)。
我面临的挑战是,我们每天收到的文件与我们拥有的3M文件之一略有相同。当输入文本不相同时,有没有一种方法或结构可以在MySQL文本中搜索文本块?我需要知道我们是否有一个或多个文档与收到的文档非常匹配。在理想的世界中,我希望得到一个与搜索文本更匹配的结果...
这样做的结果机制可能包括MySQL和Python作为解决方案。我在任何地方都找不到最好的方法来做到这一点,而且搜索不需要花费很多时间。
[Edited 2020-09-29]
从我目前发现的情况来看,对于此类问题,似乎可以使用sabik指出的Elasticsearch作为一个好的方向。

最佳答案

前一段时间,我尝试使用MySQL做类似的事情,然后发现SQL SERVER FILESTREAM。
我将文档保存在二进制类型varbinary(max)的字段中,该字段占用更少的空间,并且搜索速度非常快。
也许现在您可以看到MySQL是否具有类似于FILESTREAM的功能,但我最近尚未对其进行研究。

关于python - MySQL存储和搜索文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/64112212/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com