- android - RelativeLayout 背景可绘制重叠内容
- android - 如何链接 cpufeatures lib 以获取 native android 库?
- java - OnItemClickListener 不起作用,但 OnLongItemClickListener 在自定义 ListView 中起作用
- java - Android 文件转字符串
我一直是 MYSQL 用户,从未尝试过 Postgres。
但是MYSQL在数据量很大的情况下,在全文检索上存在瓶颈。
最佳答案
几年前,我对大型数据集进行了基准测试,发现:
速度很慢。另一个缺点是它会强制你使用 MyISAM,这会带来很多问题。一旦索引达到一定大小,索引更新也非常缓慢:当你插入一个新行时,索引的很大一部分会重新生成,有时几百兆字节的索引被重写只是为了插入一个论坛帖子。换句话说,对于一个只有几兆字节的帖子的小型论坛来说还可以,但维基百科不使用它是有原因的......
比 MySQL 全文快 10-100 倍,功能更强大,要点在插入/更新时速度很快,锁没有问题,换句话说,这是一个完全不错的解决方案。
但是,由于 MVCC,当数据集大于 RAM 时,搜索会变慢,postgres 需要通过访问堆来检查行的可见性。请注意,这可能会在未来的版本中发生变化。如果您的查询返回 10 行,没问题。但是,如果您想要 SELECT WHERE (fulltext query) ORDER BY date LIMIT 10 并且全文匹配 10.000 行,它会变得非常慢。仍然比 MySQL 快,但没有您想要的性能。
Xapian 不必遵守与数据库相同的限制,因此它可以进行更多的优化。例如,它是一个单写多读并发模型,因此您需要某种更新队列来在后台更新您的索引。它还具有自己的磁盘格式。结果是它非常快,即使数据集比 RAM 大得多,尤其是在匹配大量行、排序并仅返回最相关的行的复杂查询上。
索引也很大,可能包含很多重复的东西。结果是它不需要寻求检索内容。
基本上,一旦 Postgres 开始撞上 IO-seek 墙,MySQL 早就死了,而 Xapian 一直在快速发展。
但它并没有很好地集成到数据库中,因此使用起来比较麻烦。仅当您拥有庞大的数据集时才值得。如果这是您的情况,请尝试一下,这太棒了。如果您的数据集适合 RAM,那么 postgres 的工作就会少很多麻烦。此外,如果您想结合全文查询和数据库查询,那么集成就变得很重要。
关于mysql - 在全文搜索方面,Postgres 的性能比 MYSQL 高多少?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1037991/
我对构面有疑问,并根据构面进行了一些过滤。 我知道这是一个重复的问题,但我找不到答案。 我想知道如何在 flex 搜索中实现相同的功能。 假设我有一个有关汽车和某些方面的索引-例如模型和 颜色。 颜色
我正在尝试找到一种解决方案来为某些方面创建子方面列表。 我有一些产品的衣服尺码,它们存储在 solr 中 "Size_both":"W30L30","尺寸宽度":"W30","Size_length"
我正在尝试找到一种解决方案来为某些方面创建子方面列表。 我有一些产品的衣服尺码,它们存储在 solr 中 "Size_both":"W30L30","尺寸宽度":"W30","Size_length"
我对方面有疑问。他们不开火。我有小方面: @Aspect @Component public class SynchronizingAspect { @Pointcut("execution(
这是在 ruby 中启用散列自动生成的巧妙技巧(取自 facets): # File lib/core/facets/hash/autonew.rb, line 19 def self.a
这个问题在这里已经有了答案: 8年前关闭。 Possible Duplicate: Creating a facet_wrap plot with ggplot2 with different ann
XMLHttpRequest 能否从 http://mydomain.example/ 向 http://mydomain.example:81/ 发送请求? 最佳答案 要使两个文档被视为具有相同的来
我对 Elasticsearch 中的方面有一点问题。 我有一个表格视频,一个表格 channel ,一个 channel 有很多视频。 我只想在 X 个最新视频上显示每个 channel 的 %vi
假设我正在为 4 个人绘制数据图表:Alice、Bob、Chuck 和 Dana。我正在使用 ggplot2 制作一个多面图,每个人一个方面。我的磁盘上还有 4 张图像:Alice.png、Bob.p
我已经下载了收件箱,并且正在使用Pig和Hadoop处理电子邮件。我已经使用Pig和Wonderdog在ElasticSearch中为这些电子邮件编制了索引。 现在,我为收件箱中的每个电子邮件地址创建
我有一个模块如下: define([...], function(...){ function anothermethod() {...} function request() {....}
(defprotocol IAnimal "IAnimal" (report [o] (println (type o) " reporting.\n") (inner-repor
我有一个 Bean 需要向 InfluxDB 报告。数据库在表 INFLUX_DB_SERVER 中注册了 InfluxDB。如果你看一下代码,你会发现方法reportMemory做了很多工作,它构造
我的问题与分面有关。在下面的示例代码中,我查看了一些分面散点图,然后尝试在每个分面的基础上叠加信息(在本例中为平均线)。 tl;dr 版本是我的尝试失败了。要么我添加的平均线计算所有数据(不尊重方面变
假设我正在为 4 个人绘制数据图表:Alice、Bob、Chuck 和 Dana。我正在使用 ggplot2 制作一个多面图,每个人一个方面。我的磁盘上还有 4 张图像:Alice.png、Bob.p
尝试用两个方面包装服务类来获取此调用链: javanica..HystrixCommandAspect -> MyCustomAroundAspect -> MyService 遇到两个问题: Hys
我是 AspectJ 的初学者。我用它在我的网络驱动程序中截取屏幕截图。以下是我的包结构。 我想知道如何在 Browser 类中运行我的程序,以便它使用 Screenshots 类中定义的 Aspec
我在使用 spring aop 时遇到问题 (编辑:如果我的方法不是静态的,则代码可以正常工作) 我的包中有这个结构: aaa.bbb.ccc.Clase1.java aaa.bbb.ddd.Clas
我有一个通用存储库类,其中包含各种标记有 PostSharp 方面 (SecuredOperation) 的方法... public class Repository : IRepository, I
我有一个运行多线程的 Hibernate 事务方法“doImportImpl”。而某些记录需要依次导入,所以代码结构大致是这样的: public RecordResult doImportImpl(S
我是一名优秀的程序员,十分优秀!