- mongodb - 在 MongoDB mapreduce 中,如何展平值对象?
- javascript - 对象传播与 Object.assign
- html - 输入类型 ="submit"Vs 按钮标签它们可以互换吗?
- sql - 使用 MongoDB 而不是 MS SQL Server 的优缺点
我正在将我的应用程序搜索从 MySQL 移植到 Sphinx,我很难弄清楚这个,或者它是否需要移植(我真的想知道是否值得为这个特定的使用 sphinx效率/速度案例):
users
uid uname
1 alex
2 barry
3 david
friends
uid | fid
1 2
2 1
1 3
3 1
详情如下:
- InnoDB
- users: 索引在 uid 上,索引在 uname 上
- friends: uid,fid 的联合索引
通常情况下,用mysql搜索alex的所有好友:
$uid = 1
$searchstr = "%$friendSearch%";
$query = "SELECT f.fid, u.uname FROM friends f
JOIN users u ON f.fid=u.uid
WHERE f.uid=:uid AND u.uname LIKE :friendSearch";
$friends = $dbh->prepare($query);
$friends->bindParam(':uid', $uid, PDO::PARAM_INT);
$friends->bindParam(':friendSearch', $searchstr, PDO::PARAM_STR);
$friends->execute();
与 mysql 相比,使用 sphinx 查找 alex 的 friend 是否更有效,或者这会不会太过分了?
如果 sphinx 会更快,因为列表会影响到数千人,索引查询会是什么样子?我将如何删除 sphinx 不再存在的友谊,我可以在这种情况下提供详细的示例吗?我应该更改此查询以使用 Sphinx 吗?
最佳答案
好的,这就是我的工作方式。
我对 MongoDB 有完全相同的问题。 MongoDB“提供”搜索功能,但就像 MySQL 一样,您永远不应该使用它们,除非您想被 IO、CPU 和内存问题所困扰,并且被迫使用比平常更多的服务器来处理您的索引。
如果使用 Sphinx(或其他搜索技术),整个想法是通过拥有高性能索引搜索器来降低每台服务器的成本。
然而,Sphinx 不是存储引擎。查询跨表的确切关系并不那么简单,他们已经使用 SphinxQL 对此进行了一些修正,但由于全文索引的性质,它仍然不会像在 MySQL 中那样进行整体连接。
相反,我会将关系存储在 MySQL 中,但在 Sphinx 中有一个“用户”索引。
在我的网站中,我个人有 2 个索引:
这些每分钟更新一次。由于实时索引有时仍处于实验阶段,而且我个人已经看到了高插入/删除率的问题,所以我一直使用增量更新。因此,我会使用增量索引来更新我网站的主要可搜索对象,因为与实时索引(来 self 自己的测试)相比,它占用的资源更少且性能更高。
请注意,为了通过 delta 处理删除以及不是您的 Sphinx 集合的内容,您将需要一个 killlist 和用于 delta 索引的某些过滤器。这是我的索引中的示例:
source main_delta : main
{
sql_query_pre = SET NAMES utf8
sql_query_pre =
sql_query = \
SELECT id, deleted, _id, uid, listing, title, description, category, tags, author_name, duration, rating, views, type, adult, videos, UNIX_TIMESTAMP(date_uploaded) AS date_uploaded \
FROM documents \
WHERE id>( SELECT max_doc_id FROM sph_counter WHERE counter_id=1 ) OR update_time >( SELECT last_index_time FROM sph_counter WHERE counter_id=1 )
sql_query_killlist = SELECT id FROM documents WHERE update_time>=( SELECT last_index_time FROM sph_counter WHERE counter_id=1 ) OR deleted = 1
}
这每分钟处理一次删除和添加,这对于真正的网络应用程序来说几乎是实时的。
所以现在我们知道如何存储索引了。我需要谈谈关系。 Sphinx(即使它有 SphinxQL)不会跨数据进行积分连接,所以我个人建议在 Sphinx 之外进行关系,不仅如此,而且正如我所说,这个关系表会获得高负载,所以这可能会影响 sphinx 索引。
我会执行查询以挑选出所有 ID,并使用该组 ID 使用 sphinx API 上的“过滤器”方法将主索引过滤到特定文档 ID。一旦完成,您就可以像往常一样在 Sphinx 中搜索。这是迄今为止我发现的处理此问题的最有效方法。
始终要记住的关键是,Sphinx 是一种搜索技术,而 MySQL 是一种存储技术。请记住这一点,您应该没问题。
正如@N.B 所说(我在回答中忽略了这一点)Sphinx 确实有 SphinxSE。尽管它是原始的并且仍处于开发的测试阶段(与实时索引相同),但它确实为 Sphinx 提供了实际的 MyISAM/InnoDB 类型存储。这太棒了。但是有一些注意事项(与任何事情一样):
但是它可以/可以完成您正在寻找的工作,所以一定要调查一下。
关于mysql - Sphinx vs. MySql - 搜索好友列表(效率/速度),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11762147/
我是 Mercurial 的新手,并且不知何故仍处于评估过程中,所以这四个概念对我来说有点困惑。有些被提到等同于 Git 的 Staging/Index 概念,有些甚至比 Git 的 Staging
关闭。这个问题需要更多focused .它目前不接受答案。 想改善这个问题吗?更新问题,使其仅关注一个问题 editing this post . 6 个月前关闭。 Improve this ques
任何人都可以给我详细信息吗? 例如? #ID 是属性、特性、选择器还是 anchor ? 默认属性和默认属性是不同的东西吗? 这些都是标签还是元素? 我们将对此说些什么 这个 ..... 还有这些
关闭。这个问题需要更多focused .它目前不接受答案。 想改进这个问题吗? 更新问题,使其只关注一个问题 editing this post . 关闭 8 年前。 Improve this qu
我有一个由 Javascript 填充的下拉列表。 在决定加载时显示的默认值时,我意识到以下属性显示的值完全相同: innerText innerHTML label text textContent
我可以知道每个 Exec 之间有什么区别吗? , ExecWait , ExecShell , nsExec::Exec , nsExec::ExecToLog, nsExec::ExecToStac
当您处于版本 1 和版本 2 之间时,您会如何维护您的软件? 从我的角度来看,“补丁”、“修补程序”、“维护版本”、“服务包”等术语都很模糊,根据与您交谈的对象不同,定义也不同。 您如何称呼版本之间的
我刚刚发现在 ES6 中有一个新的数学方法:Math.trunc . 我在 MDN article 中阅读了它的描述。 , 听起来像使用 |0 . 此外,>0 , &-1 , ^0也做类似的事情(感谢
我想知道我的 StackPanel 所有项目的高度。 有什么区别: Height - 获取或设置元素的建议高度。 ActualHeight - 获取该元素的渲染高度。 (只读) ExtentHeigh
关闭。这个问题是off-topic .它目前不接受答案。 想改进这个问题吗? Update the question所以它是on-topic用于堆栈溢出。 关闭 9 年前。 Improve this
我对所有声称以某种方式阻止计算的内置 Mathematica 函数感到困惑:Unevaluated、Defer、Hold ,以及超过 6 个 Hold* 形式。 Mathematica 文档只是单独解
我什至不确定正确的术语,所以让我从我的目标开始:拥有一个简单的应用程序(“Data Doler”),它只会将大量数据从文件读取到内存中,然后提供服务将该数据切片到名为“Data Lapper”的单个多
我刚刚开始在我的项目中使用 Elasticsearch,我想像 sql 关键字一样搜索 '喜欢%' 做。 谁能解释一下 之间的区别通配符 , 前缀 , 查询字符串和 正则表达式 ? 哪个可以搜索最好性
由于我对任何主流浏览器(Firefox、Chrome、Opera)都不太满意,而且我尝试过的不太受欢迎的浏览器(近十几种)都没有,所以我决定 DIY 并制作一个网页我想要最好的浏览器。 主要目标是让它
我知道如何使用 Python 解析页面。我的问题是哪种方法是所有解析技术中最快的,其他方法的速度有多快? 我知道的解析技术有Xpath、DOM、BeautifulSoup,还有使用Python的fin
我试图从正在解析的命令行中找出哪个函数最适合将十进制、十六进制或八进制数转换为 int 最好——在不知道输入的情况下事先。 目标是使用一个函数来识别不同类型的输入并将其分配给它的整数 (int) 值,
就目前而言,这个问题不适合我们的问答形式。我们希望答案得到事实、引用资料或专业知识的支持,但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the
我们需要在我们的网站上显示酒吧、餐馆和剧院等各种场所的元信息(例如,地址、姓名)。 理想情况下,用户会输入地点名称以及邮政编码,我们会提供最接近的匹配项。 人们将哪些 API 用于类似的地理定位目的?
就目前而言,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引起辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the he
我正在创建我的第一个 Web 应用程序,我真的很困惑应该使用什么技术。 我的应用程序需要看起来很严肃(像一个应用程序),它不需要很多色彩缤纷的图形界面。它只需要一个工具栏、一个标签栏、一个拆分面板(最
我是一名优秀的程序员,十分优秀!