- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我们有一个 300 Gb 以上的数据数组,我们希望尽快查询。传统的 SQL 数据库(特别是 SQL Server)无法按照我们的需要有效地处理这个数据量(例如,在 10 秒内执行 select
,并在 where
子句中包含 10-20 个条件),因此我正在研究其他解决方案对于这个问题。
我一直在阅读有关 NoSQL 的内容整个事情看起来很有希望,但我更想听听那些在现实生活中使用过它的人的意见。
您在这里有什么建议?
编辑以阐明我们的目标。
我们是一家开发应用程序的公司,用户可以通过该应用程序搜索旅游并预订所述旅游,并使用塑料卡付款。这整件事肯定是俄罗斯特有的,所以请耐心等待。
当用户登录该网站时,她会看到类似于以下的表单:
alt text http://queenbee.alponline.ru/searchform.png
在这里,用户选择她从哪里出发、去哪里、日期、持续时间等等。
点击“搜索”后,请求将发送到我们的数据库服务器,但数据库服务器无法处理此类负载:查询包含各种参数。分片也效果不佳。
所以我想要的是某种伪数据库,它可以进行闪电般的快速查询。
最佳答案
如果您想要进行临时查询以进行报告或分析,您可能最好使用与现成的报告工具配合良好的工具。否则,您可能会发现自己一直被拖着编写小报告程序来查询数据。这是针对 NoSQL 类型数据库的攻击,但根据您的具体情况,它可能会或可能不会成为问题。
300GB 不应超出现代 RDBMS 平台的能力,甚至是 MS SQL Server。这种类型的大型数据库查询的其他一些选项是:
看看是否可以使用 SSAS 多维数据集和聚合来缓解查询性能问题。基于使用情况的优化可能会为您带来足够的性能,而无需使用另一个数据库系统。 SSAS 还可以用于无共享配置,允许您在具有直连磁盘的相对便宜的服务器集群中对查询进行 strip 化。如果您确实这样做,请查看 ProClarity 的前端。
Sybase IQ 是一个 RDBMS 平台,它使用针对报告查询而优化的基础数据结构。它的优点是可以很好地与各种传统报告工具配合使用。存在其他几种这种类型的系统,例如 Red Brick、Teradata 或 Greenplum(使用 PostgreSQL 的修改版本)。对这些系统的主要打击是它们并不完全是大众市场产品,而且可能相当昂贵。
Microsoft 正在开发一个无共享版本的 SQL Server,您也许可以使用它。然而,他们将其与第三方硬件制造商捆绑在一起,因此您只能使用专用(因此价格昂贵)的硬件来获得它。
寻找机会利用聚合数据构建数据集市,以减少某些查询的数量。
看看调整你的硬件。直连 SAS 阵列和 RAID Controller 可以非常快速地完成表扫描中使用的流式 I/O。如果您将表划分为大量镜像对,您可以获得非常快的流性能 - 很容易使 SAS channel 饱和。
实际上,您希望获得 10-20GB/秒的速度您的 I/O 子系统,如果您想要您所描述的性能目标,并且当然可以在不诉诸真正奇特的硬件的情况下做到这一点。
关于sql - 用于超快速查询的数据库,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2229420/
我有三张 table 。表 A 有选项名称(即颜色、尺寸)。表 B 有选项值名称(即蓝色、红色、黑色等)。表C通过将选项名称id和选项名称值id放在一起来建立关系。 我的查询需要显示值和选项的名称,而
在mysql中,如何计算一行中的非空单元格?我只想计算某些列之间的单元格,比如第 3-10 列之间的单元格。不是所有的列...同样,仅在该行中。 最佳答案 如果你想这样做,只能在 sql 中使用名称而
关闭。这个问题需要多问focused 。目前不接受答案。 想要改进此问题吗?更新问题,使其仅关注一个问题 editing this post . 已关闭 7 年前。 Improve this ques
我正在为版本7.6进行Elasticsearch查询 我的查询是这样的: { "query": { "bool": { "should": [ {
关闭。这个问题需要多问focused 。目前不接受答案。 想要改进此问题吗?更新问题,使其仅关注一个问题 editing this post . 已关闭 7 年前。 Improve this ques
是否可以编写一个查询来检查任一子查询(而不是一个子查询)是否正确? SELECT * FROM employees e WHERE NOT EXISTS (
我找到了很多关于我的问题的答案,但问题没有解决 我有表格,有数据,例如: Data 1 Data 2 Data 3
以下查询返回错误: 查询: SELECT Id, FirstName, LastName, OwnerId, PersonEmail FROM Account WHERE lower(PersonEm
以下查询返回错误: 查询: SELECT Id, FirstName, LastName, OwnerId, PersonEmail FROM Account WHERE lower(PersonEm
我从 EditText 中获取了 String 值。以及提交查询的按钮。 String sql=editQuery.getText().toString();// SELECT * FROM empl
我有一个或多或少有效的查询(关于结果),但处理大约需要 45 秒。这对于在 GUI 中呈现数据来说肯定太长了。 所以我的需求是找到一个更快/更高效的查询(几毫秒左右会很好)我的数据表大约有 3000
这是我第一次使用 Stack Overflow,所以我希望我以正确的方式提出这个问题。 我有 2 个 SQL 查询,我正在尝试比较和识别缺失值,尽管我无法将 NULL 字段添加到第二个查询中以识别缺失
什么是动态 SQL 查询?何时需要使用动态 SQL 查询?我使用的是 SQL Server 2005。 最佳答案 这里有几篇文章: Introduction to Dynamic SQL Dynami
include "mysql.php"; $query= "SELECT ID,name,displayname,established,summary,searchlink,im
我有一个查询要“转换”为 mysql。这是查询: select top 5 * from (select id, firstName, lastName, sum(fileSize) as To
通过我的研究,我发现至少从 EF 4.1 开始,EF 查询上的 .ToString() 方法将返回要运行的 SQL。事实上,这对我来说非常有用,使用 Entity Framework 5 和 6。 但
我在构造查询来执行以下操作时遇到问题: 按activity_type_id过滤联系人,仅显示最近事件具有所需activity_type_id或为NULL(无事件)的联系人 表格结构如下: 一个联系人可
如何让我输入数据库的信息在输入数据 5 分钟后自行更新? 假设我有一张 table : +--+--+-----+ |id|ip|count| +--+--+-----+ |
我正在尝试搜索正好是 4 位数字的 ID,我知道我需要使用 LENGTH() 字符串函数,但找不到如何使用它的示例。我正在尝试以下(和其他变体)但它们不起作用。 SELECT max(car_id)
我有一个在 mysql 上运行良好的 sql 查询(查询 + 连接): select sum(pa.price) from user u , purchase pu , pack pa where (
我是一名优秀的程序员,十分优秀!