- Java 双重比较
- java - 比较器与 Apache BeanComparator
- Objective-C 完成 block 导致额外的方法调用?
- database - RESTful URI 是否应该公开数据库主键?
只是一些上下文:在旧的数据管道系统中,我们运行的是mysql 5.6。或者亚马逊rds上的极光。旧数据管道的坏处是在数据库服务器上运行大量繁重的计算,因为我们被设计的东西束缚住了:将事务数据库视为数据仓库,我们的后端api直接“钓鱼”旧系统中的数据库。我们目前正在修补这个旧的数据管道,同时在雪花中重新设计新的数据仓库。
在我们的旧数据管道系统中,数据管道计算是一系列连续的mysql查询。随着旧数据管道中的数据越来越大,现在的问题是计算可能永远挂在第3步mysql查询上,而我们正在监视amazon cloudwatch/grafana中的所有指标(cpu、数据库连接、可用内存、网络吞吐量、交换使用、读取延迟、可用存储、写入等待时间等)看起来很正常。mysql慢速查询日志在这里并不是很有用,因为数据管道中的每个查询实际上都很慢(运行查询可能需要几个小时,因为旧数据管道在数据库服务器上运行大量繁重的计算)。我们通常解决这些问题的方法是“盲目”升级mysql/aurora amazon rds服务,希望它能解决问题。我想知道
(1)mysql 5.6推荐的数据库指标是什么?或者在amazon rds上使用aurora,我们应该实时监控以帮助我们确定为什么查询永远冻结?比如innodb_buffer_pool_size?
(2)有任何现有的工具和/或内部的方法,我们可以预测我们需要多少硬件资源,然后我们可以自信地执行一个查询,并知道它会成功吗?有人能分享2美分吗?
一种想法:由于amazon rds有时有点黑,一种可能的方法是在amazon ec2实例上托管我们自己的mysql服务器,与我们的amazon mysql 5.6/aurora rds生产服务器并行,因此,我们可以ssh到mysql服务器并运行许多命令工具,比如mytop(https://www.tecmint.com/mysql-performance-monitoring/)来收集更多的实时mysql度量,这可以帮助我们解决问题。向任何2美分的古鲁开放。谢谢您!
最佳答案
该链接中提到的任何工具都不需要在数据库服务器本身上运行,如果不是这样,那么它们的行为应该没有区别。在任何Linux服务器上运行它们,并给出适当的--host
和--user
参数和--password
参数(无论它们期望的是什么形式)。即使mysqladmin
也可以远程工作。大多数mysql命令行工具都会这样做(例如mysql
cli、mysqldump
、mysqlbinlog
甚至mysqlcheck
)。
大多数管理实用程序在mysql服务器本身所在的同一台服务器上运行并不能获得神奇的耦合——这是一个常见的误解,但事实上,即使在同一台计算机上运行,它们仍然必须与服务器建立连接,就像任何其他客户端一样。它们可以本地连接到unix套接字,而不是使用tcp,但它仍然是一个普通的客户端连接,并且不提供额外的功能。
也可以在自己的ec2实例(甚至在自己的数据中心)上运行rds/mysql或aurora/mysql服务器的外部副本。但这不太可能告诉您很多您无法从rds度量中学习的东西,特别是在上述情况下。(还要注意的是,即使是副本服务器也会使用返回主服务器的普通客户端连接获取其复制流。)
避免调整服务器参数的诱惑。在rds上,大多数默认值都是非常正常的,除非您明确地知道为什么要调整参数……别这么做。
最可能的解释是查询速度慢…是写得不好的查询和/或设计得不好的索引。
如果你不熟悉EXPLAIN SELECT
,那么你需要学习它,生活它,爱它。sql是声明性的,而不是过程性的。也就是说,SQL告诉服务器您想要什么——而不是具体地告诉服务器如何在内部获得它。例如:SELECT ... FROM x JOIN y
告诉服务器根据特定条件匹配表x和表y中的行,但不告诉服务器是否从ON
读取,然后在x
中找到匹配的行。或者从y
中读取并在y
中找到匹配的行。无论哪种方式,最终的结果都是一样的——服务器首先在内部检查哪一个表并不重要——但是如果查询或索引不允许服务器正确地推断到您所请求的结果的最佳路径,那么它可能会花费无数个小时来完成不必要的工作。
以一个极端而过度简化的例子为例,一个有数百万行的表和一个有一行的表。首先读取小表是有意义的,这样您就知道要将哪个1值加入到大表中。读取大表中的每一行,然后检查小表中数百万行的每一行是否匹配是没有意义的。联接表的顺序可以不同于实际联接的顺序。
这就是x
的来源。这允许您检查查询计划——内部查询优化器得出的策略将以最少的工作量获得您需要的答案。这是关系数据库系统魔力的核心——根据对数据的了解,在最佳时间内找到正确的解决方案。EXPLAIN
向您显示访问表的顺序、如何联接表、使用哪些索引以及每个表中所涉及的行数的估计值,这些数字相乘起来,可以估计解析查询时所涉及的排列数。两个小表,每个表有50000行,在没有适当索引的情况下连接,意味着必须计算的两个表之间完全不合理的2500000000个唯一组合;每一行必须与每一行进行比较。简而言之,如果这是您(不知不觉)要求服务器做的事情,那么您肯定是做错了什么。在编写复杂查询时,检查查询计划应该是第二种性质,以确保服务器使用合理的策略来解决它。
输出是神秘的,但秘密解码器环是可用的。
https://dev.mysql.com/doc/refman/5.7/en/explain.html#explain-execution-plan
关于mysql - Amazon RDS MySQL/Aurora查询有时会永远挂起。我们可以对指标和方法进行分类并防止其发生的任何2美分?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45929075/
尝试使用集成到 QTCreator 的表单编辑器,但即使我将插件放入 QtCreator.app/Contents/MacOS/designer 也不会显示。不过,相同的 dylib 文件确实适用于独
在此代码示例中。 “this.method2();”之后会读到什么?在返回returnedValue之前会跳转到method2()吗? public int method1(int returnedV
我的项目有通过gradle配置的依赖项。我想添加以下依赖项: compile group: 'org.restlet.jse', name: 'org.restlet.ext.apispark', v
我将把我们基于 Windows 的客户管理软件移植到基于 Web 的软件。我发现 polymer 可能是一种选择。 但是,对于我们的使用,我们找不到 polymer 组件具有表格 View 、下拉菜单
我的项目文件夹 Project 中有一个文件夹,比如 ED 文件夹,当我在 Eclipse 中指定在哪里查找我写入的文件时 File file = new File("ED/text.txt"); e
这是奇怪的事情,这个有效: $('#box').css({"backgroundPosition": "0px 250px"}); 但这不起作用,它只是不改变位置: $('#box').animate
这个问题在这里已经有了答案: Why does OR 0 round numbers in Javascript? (3 个答案) 关闭 5 年前。 Mozilla JavaScript Guide
这个问题在这里已经有了答案: Is the function strcmpi in the C standard libary of ISO? (3 个答案) 关闭 8 年前。 我有一个问题,为什么
我目前使用的是共享主机方案,我不确定它使用的是哪个版本的 MySQL,但它似乎不支持 DATETIMEOFFSET 类型。 是否存在支持 DATETIMEOFFSET 的 MySQL 版本?或者有计划
研究 Seam 3,我发现 Seam Solder 允许将 @Named 注释应用于包 - 在这种情况下,该包中的所有 bean 都将自动命名,就好像它们符合条件一样@Named 他们自己。我没有看到
我知道 .append 偶尔会增加数组的容量并形成数组的新副本,但 .removeLast 会逆转这种情况并减少容量通过复制到一个新的更小的数组来改变数组? 最佳答案 否(或者至少如果是,则它是一个错
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开,visit the help center . 关闭 1
noexcept 函数说明符是否旨在 boost 性能,因为生成的对象中可能没有记录异常的代码,因此应尽可能将其添加到函数声明和定义中?我首先想到了可调用对象的包装器,其中 noexcept 可能会产
我正在使用 Angularjs 1.3.7,刚刚发现 Promise.all 在成功响应后不会更新 angularjs View ,而 $q.all 会。由于 Promises 包含在 native
我最近发现了这段JavaScript代码: Math.random() * 0x1000000 10.12345 10.12345 >> 0 10 > 10.12345 >>> 0 10 我使用
我正在编写一个玩具(物理)矢量库,并且遇到了 GHC 坚持认为函数应该具有 Integer 的问题。是他们的类型。我希望向量乘以向量以及标量(仅使用 * ),虽然这可以通过仅使用 Vector 来实现
PHP 的 mail() 函数发送邮件正常,但 Swiftmailer 的 Swift_MailTransport 不起作用! 这有效: mail('user@example.com', 'test
我尝试通过 php 脚本转储我的数据,但没有命令行。所以我用 this script 创建了我的 .sql 文件然后我尝试使用我的脚本: $link = mysql_connect($host, $u
使用 python 2.6.4 中的 sqlite3 标准库,以下查询在 sqlite3 命令行上运行良好: select segmentid, node_t, start, number,title
我最近发现了这段JavaScript代码: Math.random() * 0x1000000 10.12345 10.12345 >> 0 10 > 10.12345 >>> 0 10 我使用
我是一名优秀的程序员,十分优秀!