ruby-on-rails - ActiveRecord 批量数据，内存永远增长-6ren

ruby-on-rails - ActiveRecord 批量数据，内存永远增长

转载作者：行者123 更新时间：2023-12-01 05:36:06

24

4

我正在使用 ActiveRecord 将一些数据从一个数据库中的表批量迁移到另一个数据库中的另一个表。大约 400 万行。

我正在使用 find_each 批量获取。然后我对获取的每条记录进行一些逻辑处理，并将其写入不同的数据库。我尝试过直接一一写入，并使用不错的 activerecord-import gem 进行批量写入。

但是，无论哪种情况，在导出/导入的整个生命周期中，我的 ruby 进程内存使用量都在增长。我认为使用 find_each，我得到了 1000 个批次，一次应该只有 1000 个在内存中......但不，我获取的每条记录似乎都在永远消耗内存，直到过程结束。

有任何想法吗？ ActiveRecord 是否在某处缓存了一些我可以关闭的内容？

2012 年 1 月 17 日更新

我想我会放弃这个。我试过了:
* 确保所有内容都包含在 ActiveRecord::Base.uncached do 中
* 添加 ActiveRecord::IdentityMap.enabled = false (我认为应该关闭当前线程的身份映射，尽管它没有明确记录，而且我认为身份映射在当前 Rails 中无论如何都没有默认开启)

这些似乎都没有太大影响，内存仍在泄漏。

然后我添加了一个周期性的显式:

GC.start

这似乎减慢了内存泄漏的速度，但内存泄漏仍然发生(最终耗尽所有内存和轰炸)。

所以我想我要放弃了，并决定目前不可能使用 AR 从一个数据库中读取数百万行并将它们插入到另一个数据库中。也许正在使用的特定于 MySQL 的代码中存在内存泄漏(这是我的数据库)，或者在 AR 中的其他地方，或者谁知道。

最佳答案

我建议将每个工作单元排队到 Resque队列。我发现 ruby 在迭代像这样的大型数组时有一些怪癖。

让一个主线程按 ID 将工作排队，然后让多个 resque 工作人员点击该队列以完成工作。

我已经在大约 30 万条记录上使用了这种方法，所以它很可能会扩展到数百万条。

关于ruby-on-rails - ActiveRecord 批量数据，内存永远增长，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/8674047/

24

4

0

文章推荐： netty - 如何在 Netty 3.2.7 中实现 ObjectDecoder(ClassResolver)

文章推荐： java - LibGDX:处理时出现 AssetsManager GdxRuntimeException

activerecord - CaSTLe ActiveRecord 播种主键值
我想知道如何使用 CaSTLe AR 来“播种”自动递增的主键值？例如，希望 Orders 表的主键从 10000 开始。这是 1. 可能的 2. 创建订单号的好解决方案吗？也许有一种方法可以在不是
activerecord - 如何将 activerecord 结果转换为包含根的哈希数组
假设你想 records = Model.all records.to_a.map{|m| m.serializable_hash(:root => true)} 就像 to_json(:root =
activerecord - 为多个模型动态实例化 ActiveRecord Observer
我目前正在尝试开发一个插件/gem 来观察多个模型。理想情况下，观察者应该只用一个单例方法自动实例化...... class MyModel true observe ActiveRecord:
activerecord - Rails (ActiveRecord) 合并或如何仅更新表中的空值
使用 Mysql 我可以使用 COALESCE仅更新表中为空的值。我怎样才能用 Rails (ActiveRecord) 做到这一点？我不想创建 if表中每一列的语句，我猜如果我将 ActiveR
activerecord - Yii2 ActiveRecord 保存空值而不是实际值
我从 Yii2 开始，想要将一些内容保存到我的数据库中。这是我的模型: class Course extends ActiveRecord { public $name; public
caSTLe-activerecord - ActiveRecord 是不好的做法吗？
我正在开始一个新项目，最近我发现了 caSTLe 项目 activerecord，这似乎是一个很棒的解决方案，但与此同时，它看起来确实是非常规的。我想知道，这种感觉是来自学习新东西(我应该习惯它)还是
activerecord - 为什么 activerecord 乐观锁定每行只工作一次？
不知何故，我总是在周五收到这些。我之前的问题是关于同样的问题，但我现在可以缩小范围: 我一整天都在研究这个问题，试图理解它。我有一个带有 lock_version 列的表，如此指定: add_col
activerecord - 实现一个 ActiveRecord before_find
我正在使用表中缓存的关键字构建搜索。在表中查找用户输入的关键字之前，它会被规范化。例如，删除了一些标点符号，如“-”，并标准化了大小写。然后使用规范化的关键字来查找获取搜索结果。我目前正在使用 be
activerecord - 设置和测试以防止 ActiveRecord 中的重复多对多关系
我有以下类用于“项目”和“颜色”之间的多对多关系。并且“项目”不应该有重复的“颜色”，例如:-如果“Item1”有“Blue”和“Red”，那么我们不能向“Item1”添加另一个“Red” 这是正确
activerecord - Yii2 ActiveRecord 关系属性的设置方法
我对 Yii2 事件记录处理关系属性的方式感到困惑。是否可以将事件记录对象链接到另一个对象而不先保存它？例如，我想将图像作为 Logo 添加到公司记录中，但尚未决定是否应保存这两个记录。给定一家公司
activerecord - 你知道如何在 CaSTLe ActiveRecord 中实现事务吗？
我决定使用 Castle ActiveRecord 为客户制作一个系统，一切都很顺利，直到我发现交易不起作用，例如； TransactionScope t = new T
activerecord - yii2 ActiveRecord findBySql - 响应内容不能是数组错误
Yii2 的新特性。只是试图从 ActiveRecord 查询中获得返回。我意识到使用 Yii2 约定可能有更简单的方法来做到这一点 public function actionGet_permis
activerecord - 数据库配置没有指定适配器(Sinatra + Heroku + Activerecord)
我收到一个错误(在 Sinatra + ActiveRecord Heroku 上)数据库配置没有指定适配器。根据一些研究，这似乎是因为 Heroku 预计在 rackup 期间不使用环境变量。我
activerecord - Rails ActiveRecord 按日期查找/搜索
我正在尝试按“created_at”日期查找记录 - 数据库列类型为“日期时间”并且我正在使用来自 jQuery 的 UI DatePicker 我的网址如下所示:“localhost:3000/u
activerecord - Yii2:如何从外部将 ActiveRecord 对象的属性设置为只读？
我想问这个问题。但我认为 BlameableBehavior和 TimestampBevavior可能是需要这样做的好例子: 我必须做什么才能使属性只能从 ActiveRecord 对象的外部读取而不
activerecord - 获取 ActiveRecord 中每个组的最小值/最大值
这是一个古老的问题，其中给定一个具有“类型”、“品种”和“价格”属性的表，您可以获取每种类型的最低价格的记录。在 SQL 中，我们可以做 this通过: select f.type, f.varie
activerecord - Yii2:如何在 ActiveRecord 中设置默认属性值？
这似乎是一个微不足道的问题，但是我能想到的所有明显的解决方案都有自己的缺陷。我们想要的是能够为新记录设置任何默认的 ActiveRecord 属性值，以使其在验证之前和期间可读并且不干扰用于搜索的派
activerecord - 是否可以获得关联的 ActiveRecord::Relation 对象
做关联方法，比如has_many定义的那些和 belongs_to利用 ActiveRecord::Relation ? 如果是这样，是否有可能获得 ActiveRecord::Relation正在使
activerecord - ActiveRecord 中的 SQL 长度？
如何将 MySQL 的 WHERE 转换为 ActiveRecord :condition？ SELECT * FROM users WHERE LENGTH(users.last_name) [
activerecord - SubSonic 3 ActiveRecord 生成的代码带有警告
当使用带有 ActiveRecord T4 模板的 SubSonic 3 时，生成的代码会显示许多关于 CLS 合规性、未使用的项目和缺少 GetHashCode() 实现的警告。为了避免它们，我做

首页

博学

6Ren·AI

商城

ruby-on-rails - ActiveRecord 批量数据，内存永远增长