mysql - Sphinx vs. MySql - 搜索好友列表(效率/速度)-6ren

mysql - Sphinx vs. MySql - 搜索好友列表(效率/速度)

转载作者：IT老高更新时间：2023-10-29 00:03:44

28

4

我正在将我的应用程序搜索从 MySQL 移植到 Sphinx，我很难弄清楚这个，或者它是否需要移植(我真的想知道是否值得为这个特定的使用 sphinx效率/速度案例):

users
uid uname
  1    alex
  2    barry
  3    david

friends
uid | fid
  1     2
  2     1
  1     3
  3     1

详情如下:
- InnoDB
- users: 索引在 uid 上，索引在 uname 上
- friends: uid,fid 的联合索引

通常情况下，用mysql搜索alex的所有好友:

$uid = 1
$searchstr = "%$friendSearch%";
$query = "SELECT f.fid, u.uname FROM friends f 
          JOIN users u ON f.fid=u.uid
          WHERE f.uid=:uid AND u.uname LIKE :friendSearch";
$friends = $dbh->prepare($query);
$friends->bindParam(':uid', $uid, PDO::PARAM_INT);
$friends->bindParam(':friendSearch', $searchstr, PDO::PARAM_STR);
$friends->execute();

与 mysql 相比，使用 sphinx 查找 alex 的 friend 是否更有效，或者这会不会太过分了？
如果 sphinx 会更快，因为列表会影响到数千人，索引查询会是什么样子？我将如何删除 sphinx 不再存在的友谊，我可以在这种情况下提供详细的示例吗？我应该更改此查询以使用 Sphinx 吗？

最佳答案

好的，这就是我的工作方式。

我对 MongoDB 有完全相同的问题。 MongoDB“提供”搜索功能，但就像 MySQL 一样，您永远不应该使用它们，除非您想被 IO、CPU 和内存问题所困扰，并且被迫使用比平常更多的服务器来处理您的索引。

如果使用 Sphinx(或其他搜索技术)，整个想法是通过拥有高性能索引搜索器来降低每台服务器的成本。

然而，Sphinx 不是存储引擎。查询跨表的确切关系并不那么简单，他们已经使用 SphinxQL 对此进行了一些修正，但由于全文索引的性质，它仍然不会像在 MySQL 中那样进行整体连接。

相反，我会将关系存储在 MySQL 中，但在 Sphinx 中有一个“用户”索引。

在我的网站中，我个人有 2 个索引:

main(包含用户、视频、 channel 和播放列表)
help(帮助系统搜索)

这些每分钟更新一次。由于实时索引有时仍处于实验阶段，而且我个人已经看到了高插入/删除率的问题，所以我一直使用增量更新。因此，我会使用增量索引来更新我网站的主要可搜索对象，因为与实时索引(来 self 自己的测试)相比，它占用的资源更少且性能更高。

请注意，为了通过 delta 处理删除以及不是您的 Sphinx 集合的内容，您将需要一个 killlist 和用于 delta 索引的某些过滤器。这是我的索引中的示例:

source main_delta : main
{
    sql_query_pre = SET NAMES utf8
    sql_query_pre =
    sql_query = \
        SELECT id, deleted,  _id, uid, listing, title, description, category, tags, author_name, duration, rating, views, type, adult, videos, UNIX_TIMESTAMP(date_uploaded) AS date_uploaded \
        FROM documents \
        WHERE id>( SELECT max_doc_id FROM sph_counter WHERE counter_id=1 ) OR update_time >( SELECT last_index_time FROM sph_counter WHERE counter_id=1 )

    sql_query_killlist = SELECT id FROM documents WHERE update_time>=( SELECT last_index_time FROM sph_counter WHERE counter_id=1 ) OR deleted = 1
}

这每分钟处理一次删除和添加，这对于真正的网络应用程序来说几乎是实时的。

所以现在我们知道如何存储索引了。我需要谈谈关系。 Sphinx(即使它有 SphinxQL)不会跨数据进行积分连接，所以我个人建议在 Sphinx 之外进行关系，不仅如此，而且正如我所说，这个关系表会获得高负载，所以这可能会影响 sphinx 索引。

我会执行查询以挑选出所有 ID，并使用该组 ID 使用 sphinx API 上的“过滤器”方法将主索引过滤到特定文档 ID。一旦完成，您就可以像往常一样在 Sphinx 中搜索。这是迄今为止我发现的处理此问题的最有效方法。

始终要记住的关键是，Sphinx 是一种搜索技术，而 MySQL 是一种存储技术。请记住这一点，您应该没问题。

编辑

正如@N.B 所说(我在回答中忽略了这一点)Sphinx 确实有 SphinxSE。尽管它是原始的并且仍处于开发的测试阶段(与实时索引相同)，但它确实为 Sphinx 提供了实际的 MyISAM/InnoDB 类型存储。这太棒了。但是有一些注意事项(与任何事情一样):

语言是原始的
连接是原始的

但是它可以/可以完成您正在寻找的工作，所以一定要调查一下。

关于mysql - Sphinx vs. MySql - 搜索好友列表(效率/速度)，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/11762147/

28

4

0

文章推荐： PHP 检测源图像 url 链接是否指向 "broken"图像？

文章推荐： android - 如何获取 Android 线程 ID？

文章推荐： php - PHP/Apache 的内存上限

Python 这段代码做了什么？列表=列表[列表!=值]
如标题所示，ans_list是一个答案列表，ans_index是一个数字(答案在词汇表中的索引，但与atm无关) 这里生成的 tree.anslist 是什么？ (例如，仅针对第一个)，忽略迭代。 f
MySQL 列表 IN 列表
我目前将用户的输入存储在逗号分隔的列表中，如下所示: Userid | Options 1 | 1,2,5 用户在一个数组形式中勾选一组选项，然后用逗号连接起来 1,2,5 然后 MySQ
MySQL 列表 IN 列表
我目前将用户的输入存储在逗号分隔的列表中，如下所示: Userid | Options 1 | 1,2,5 用户在一个数组形式中勾选一组选项，然后用逗号连接起来 1,2,5 然后 MySQ
list - 我怎样才能完全展平一个列表(列表(列表)......)
我想知道如何完全展平列表和包含它们的东西。除其他外，我想出了一个解决方案，它可以将具有多个元素的东西滑倒并将它们放回原处，或者在滑倒后将具有一个元素的东西拿走。这与 How do I “flatte
list - 我怎样才能完全展平一个列表(列表(列表)......)
我想知道如何完全展平列表和包含它们的东西。除其他外，我想出了一个解决方案，它可以将具有多个元素的东西滑倒并将它们放回原处，或者在滑倒后将带有一个元素的东西拿走。这与 How do I “flatte
java - 列表<列表<字符串>>到字符串[][]
这个问题已经有答案了: Convert nested list to 2d array (3 个回答) 已关闭 7 年前。 java中有没有快捷方式可以转换 List> 到 String[][] ？
java - 列表<列表<对象>>排序
我在排序时遇到问题 List> 。我创建了一个自定义比较器，在其中编写了对数据进行排序的代码。 public class CustomComparator implements Comparator
java - 列表数组列表转换
这个问题已经有答案了: 已关闭10 年前。 Possible Duplicate: Java Generics: Cannot cast List to List? 我只是想知道为什么下面的java代
c# - 列表<逗号分隔的字符串> => 列表<字符串>?
试图想出一个 LINQy 方法来做到这一点，但我什么也没想到。我有一个对象列表<>，其中包含一个属性，该属性是逗号分隔的字母代码列表: lst[0].codes = "AA,BB,DD" lst[1
python - 列表 += 元组与列表 = 列表 + 元组
假设我有这些任务: points = [] point = (1, 2) 我怎么会这样做: points += point 它工作得很好，并且给了我点 = [1, 2]。但是，如果我这样做: poin
scala - 将列表[任务[列表[A]]]转换为任务[列表[A]]
如何在 scala 中将 List[Task[List[Header]]] 类型转换为 Task[List[Header]]。我有一个方法返回 Task[List[Header]] 并多次调用 do
java - 如何在Java中获取二维列表的元素？例如，列表<列表<整数>>
如何在 Java 中查找二维列表的元素？我有一个参数为 List> 的函数我想知道如何找到这个列表的行和列。最佳答案如果你喜欢 List> obj 然后你就可以像这样访问 obj.get(cur
java - 列表<列表没有按预期工作
分配 List到 List工作正常。分配 List>到 List>不编译。代码 public class Main { public static void main(String[] a
java - 列表<可序列化> vs 列表
我正在用 Java 编写一个方法，该方法必须接收并迭代 Serializable 的 List。有什么区别: public void myMethod(List list) { } 和 public
java - 通知网格/列表/树内网格/列表/树的更改
我看到很多人想用 mvvm 更新网格/列表/树的一部分，但他们不想刷新整个列表。对于所有遇到此问题的人，我做了以下示例。希望这对你有用。最佳答案这是一个简单的例子。整个代码中最重要的是: Bi
C++ 列表到 Python 列表
我正在为现有的 C++ 库编写包装器，该库使用列表，其中 T 是自定义结构。我被建议使用 vector 而不是列表，但我试图避免修改库。为了更好地理解这个场景，我做了一个简单的应用程序，使用一个列表
java - 列表 VS 列表<基础>
List list List list 这两种声明有什么区别吗？谢谢，最佳答案是的。 List可以包含所有派生自 Base 的不同事物的混合物. List包含同质项(从某种意义上说，它们必须全部
Java 泛型 : List, 列表<对象>、列表
有人可以尽可能详细地解释以下类型之间的区别吗？ List List List 让我更具体一点。我什么时候想使用 // 1 public void CanYouGiveMeAnAnswer(List l
python - 是否有任何 python 模块可以计算(列表，列表)元组的频率？
我有一个元组列表，每个元组都是一对列表。所以我的数据看起来像: mylist = [(['foo', 'bar'], ['bar', 'bar']),(['bar', 'bar'],['bar', '
list - 给定一个 (a * b) 列表，返回一个 (a * b list) 列表
也许是一个时髦的标题，但我遇到了以下问题: 给定一个类型为 (a * b) list 的列表，我想创建一个类型为 (a * b list) list 的新列表。一个例子: 给定列表 let testL

首页

博学

6Ren·AI

商城

mysql - Sphinx vs. MySql - 搜索好友列表(效率/速度)

编辑