python - 使用python多处理器将数据导入到mysql RDS

python - 使用python多处理器将数据导入到mysql RDS - RDS

转载作者：行者123 更新时间：2023-11-29 22:45:54

28

4

当我在 python 中使用多处理器运行数据导入器时，发生了一些非常奇怪的行为。我相信这是一个数据库问题，但我不知道如何追踪它。下面是我正在做的过程的描述:

1) 运行 XX 个处理器的多处理器文件，执行第二部分和第三部分

2) 队列处理器，循环访问 sqs 队列来提取公司 ID。这个id用于拉取存储在mysql中的json字符串。这个json字符串作为json对象加载并发送到解析文件，该解析文件对数据进行规范化，以便可以将其作为规范化数据导入到mysql中。

3) 公司解析器/导入器读取 json 对象并创建插入到 mysql 数据库中，从而规范化数据。这些以 XXX 大小的批处理批量插入到 RDS 中，以缓解 IOPS 问题。

此代码从 c4.Large 实例运行并且有效。启动后，它运行速度很快(每分钟约 30,000 次插入)，而不会耗尽 RDS 或 ec2 实例上的 IOPS、CPU 或其他资源。然后，经过一定时间(5-30分钟)后，RDS服务器的CPU下降到~20%，并且出现奇怪的心跳类型的节奏。我尝试启动额外的 ec2 实例来加速此过程，但导入速度保持不变且缓慢(每分钟约 2000 次插入)，因此我认为瓶颈在于 RDS 实例。我尝试将 RDS 实例的大小从中型更改为大型，但没有任何变化。我还尝试将 RDS 实例的 IOPS 更改为配置为 10k 的 SSD。这也没有解决问题

据我所知，RDS 服务器存在某种限制或限制。但是，我不知道还能去哪里寻找。没有关于受到限制的危险信号。

您能否提供发生此类行为的其他潜在原因？我不知道还要测试什么。

当前设置为 500gb t2.medium RDS 实例，写入 IOPS 约为 200，CPU 约为 20%，读取 IOPS < 20，队列 < 1，稳定的 12 db 连接(这不是连接然后断开)，以及大量可用内存。

最佳答案

我通过将实例类型升级为 m3.Large 实例(没有 CPU 积分限制)解决了这个问题。现在一切正常。

关于python - 使用python多处理器将数据导入到mysql RDS - RDS，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/29129589/

28

4

0

文章推荐： MySQL，存储大量记录

文章推荐： java - AutoCompleteTextView NullPointerException

文章推荐： php - 如何在PHP中找到25个连续列的平均值

amazon-rds - RDS 集群和数据库实例概念
我需要创建 RDS Aurora 5.7 数据库。我想我对 RDS 的概念不是很清楚。这是正确的层次结构吗？ aws_rds_cluster -> aws_rds_cluster_instance -
amazon-rds - RDS 安全组入口规则
我正在开发包含 RDS 数据库的 CloudFormation 模板，并且我想将安全组附加到 RDS。有一个资源AWS::RDS::DBSecurityGroup我想编写自己的入口规则，通过附加此资源
amazon-rds - RDS 实例的规范名称
我有不同的 EC2 实例尝试访问 RDS 实例。我想在配置文件中预先设置 RDS 实例“规范名称”，以便在部署后我不需要对配置文件进行任何更改。我有以下问题: 无论如何，人们可以在cloudform
python - 使用python多处理器将数据导入到mysql RDS - RDS
当我在 python 中使用多处理器运行数据导入器时，发生了一些非常奇怪的行为。我相信这是一个数据库问题，但我不知道如何追踪它。下面是我正在做的过程的描述: 1) 运行 XX 个处理器的多处理器文件，
SpringBoot, Hibernate and AWS RDS (Aurora) with new CA rds-ca-ecc384-g1(SpringBoot、休眠和AWS RDS(Aurora)以及新的CA rds-ca-ecc384-G1)
我有一个SpringBoot应用程序，它使用以下配置与PostgreSQL通信，通过AWS Beanstrik部署：。在我将AWS Aurora证书更新为rds-ca-ecc384-g1之前，一切都很
amazon-rds - AWS RDS 保留期超过了实例设置中指定的期限
我有一个带有 PostgreSQL 的 AWS RDS 实例。在实例创建过程中，我将自动备份的最大保留期指定为 7。但我可以在快照部分看到过去 9 天的自动备份。有谁知道这里发生了什么？最佳答案
amazon-rds - Amazon RDS 实例是否可以升级？
我是否能够根据需要切换(我的意思是升级或降级)Amazon RDS 实例，还是必须重新创建一个新实例并进行迁移？最佳答案是，Amazon RDS 实例可通过 modify-db-instance
amazon-rds - AWS RDS 使用的操作系统
Amazon RDS 使用哪些操作系统。虽然我知道在使用 RDS 时我们只是暴露于一个端点，并且在内部我们使用的数据库可能受多个系统支持，但我想知道这些系统使用的操作系统是什么。最佳答案要检查 A
amazon-rds - 使用最新引擎版本创建 RDS 数据库集群
来自文档 https://docs.aws.amazon.com/AmazonRDS/latest/APIReference/API_CreateDBCluster.html ,CreateDBClu
amazon-rds - RDS 参数组 - 动态和静态
此处提到的动态参数与静态参数的示例是什么？ Here are some important points you should know about working with parameters i
amazon-rds - Amazon RDS 多可用区故障转移
正在考虑使用多可用区的 RDS Oracle 产品。我找不到一件事 - 如果您的主实例消失并且您故障转移到辅助实例，您会回到主实例吗？或者次要成为主要，然后另一个实例(可能是您的旧主要)成为次要？ R
amazon-web-services - 将 AWS RDS SSL/TLS 证书从 rds-ca-2015 更新为 rds-ca-2019
我们最近将 AWS rds 的 SSL 从 rds-ca-2015 更新为 rds-ca-2019。现在应用程序可以正常工作并与 SSL 连接，但我们现在无法使用 rds-ca-2019 确认 rds
amazon-rds - AWS EKS 节点访问 RDS
我让 AWS EKS 节点访问 RDS，其中我在 RDS 的安全组中将 EKS 节点的公共(public) IP 列入白名单。但这不是可行的解决方案，因为 EKS 节点可以被替换，其公共(public
amazon-rds - 如何在没有循环依赖的情况下使用 CDK 将安全组添加到现有 RDS
我有一个多堆栈应用程序，我想在一个堆栈中部署 RDS，然后在稍后的堆栈中部署一个连接到 RDS 的 Fargate 集群。以下是 rds 的定义方式: this.rdsSG = new ec
amazon-rds - RDS : Free Memory,事件内存和可释放内存的三个指标之间有什么关系？
AWS RDS的三个指标是什么:可用内存(增强监控)，事件内存(增强监控)和可用内存(CloudWatch监控)？它们之间是什么关系？看这两张照片。三个指标的值不同。的形象 enter ima
amazon-rds - 如何在不停机的情况下更改 AWS-RDS 实例类型？
我正在使用 AWS-RDS(Aurora MySQL5.6) 并且它是一个集群，它有一个写入器实例和一个读取器实例。我发现当我改变它的类型时，每个实例都会停机近 10 分钟，这是 Not Accept
amazon-rds - 如何减少我的 AWS RDS 实例的费用
我们目前每月为 RDS 使用支付 85-100 美元之间的费用。但大多数时候我们不访问我们的数据库实例。有没有办法通过关闭实例或进入共享数据库模式来减少计费。有哪些替代方案？最佳答案您可以随时使用
amazon-rds - Amazon RDS (postgres) 连接限制？
我搜索了网络并浏览了 RDS 文档，但似乎找不到开放连接限制。就其值(value)而言，我计划使用 RDS 的新 Postgres 风格，但我认为来自 mySQL 方面的答案也可以接受。谢谢! 最
amazon-rds - Terraform 计划想要销毁导入的 RDS 资源
我使用以下命令将之前部署的 RDS 实例替换为手动配置的 RDS 实例: ./terraform destroy -target aws_db_instance.my_db ./terraform i
amazon-rds - Terraform 计划想要销毁导入的 RDS 资源
我使用以下命令将之前部署的 RDS 实例替换为手动配置的 RDS 实例: ./terraform destroy -target aws_db_instance.my_db ./terraform i

首页

博学

6Ren·AI

商城

python - 使用python多处理器将数据导入到mysql RDS - RDS