ruby-on-rails - 递归ruby方法中的明显内存泄漏-6ren

ruby-on-rails - 递归ruby方法中的明显内存泄漏

转载作者：太空宇宙更新时间：2023-11-03 17:48:28

26

4

此脚本一运行，我就看到服务器上的 CPU 使用率和磁盘 IO 水平稳步上升，直到它最终被终止。

这是一个脚本，它通过从数据库中选择一个未抓取的 url，抓取它并将其链接添加到数据库来递归地抓取站点。

我假设函数内或函数与 ActiveRecord 交互的方式存在某种内存泄漏。有什么方法可以提高效率并堵住漏洞？

def self.site project, operate

  @log = Logger.new(STDOUT)

  recurse = ->() do
    #
    # Pick a from the database to crawl
    unless ProjectData.where( status: 'unscraped', project_id: project[:id] ).exists?
      @log.info "No pages to scrape"
      return
    end  

    working_page = ProjectData.where( status: 'unscraped', project_id: project[:id]).first
    working_page.status = 'processing'
    working_page.save

    @log.info "Scraping #{working_page.url}"
    #
    #   Scape it
    data, links = OutriderTools::Scrape::page( working_page.url, operate)

    unless links.nil? 
      links.each  do |link|
        # Check if link already exists
        #if ProjectData.find_by(url: link.to_s).nil?
        unless ProjectData.where( url: link.to_s, project_id: project[:id] ).exists?  
          ProjectData.create({
            :url        => link.to_s,
            :status     => 'unscraped',
            :project_id => project[:id]
          })
          @log.info "Adding new url to database: #{link.to_s}"
        else
          @log.info "URL already exists in database: #{link.to_s}"
        end
      end
    end

    @log.info "Saving page data for url #{working_page.url}"
    @log.info data[:status]
    working_page.update( data ) unless data.nil?

    recurse.call

  end

  recurse.call

end

最佳答案

只是一个想法，不是答案:

我希望您知道，通过使用递归，您可以将所有收集到的数据和变量保存在内存中——在递归结束之前，它们永远不会被释放。

例如，working_page 和 links 变量(连同 DB ActiveRecord 类)都在内存中保持事件状态，而新的 working_page 和links 变量在递归命名空间中创建。

可能没有内存泄漏，只是设计问题。

除非您在递归之后再次需要该数据——您似乎并不需要——否则最好使用 while 循环:

working_page = nil
while (working_page = ProjectData.where( status: 'unscraped', project_id: project[:id] ).first)
   # ... do your thing...
end

(= 不是错误。它被用作一个赋值，整个赋值被审查以检查 working_page 是否有一个对象存在并分配给它)

关于ruby-on-rails - 递归ruby方法中的明显内存泄漏，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/29789996/

26

4

0

文章推荐： python - 使用 scrapy 将 itemloader 按项目写入 xml 或 csv

文章推荐： Python套接字: WinError 10022

文章推荐： ruby-on-rails - 如何在 Rails 应用程序中测试简单的 Ruby 类？

java - Android - IntentReceiver 泄漏/泄漏/泄漏
IntentReceiver 正在泄漏由于 onDetachedFromWindow 在某些情况下未被调用。 @Override protected void onDetachedFromWind
iPhone - UIImage 泄漏、CGBitmapContextCreateImage 泄漏
好吧，我很难追踪这个内存泄漏。运行此脚本时，我没有看到任何内存泄漏，但我的 objectalloc 正在攀升。 Instruments 指向 CGBitmapContextCreateImage >
iphone - 使用仪器检测 C 泄漏(泄漏)
我编写了一个测试代码来检查如何使用 Instrument(Leaks)。我创建了一个单一 View 应用程序，单击按钮后我加载了一个像这样的新 View ... - (IBAction)btn_clk
Python单调增加内存使用量(泄漏？)
我正在使用这个简单的代码并观察单调增加的内存使用量。我正在使用这个小模块将内容转储到磁盘。我观察到它发生在 unicode 字符串上而不是整数上，我做错了什么吗？当我这样做时: >>> from u
iphone - NSXMLParser 泄漏
我有以下泄漏的代码。 Instruments 表示，泄漏的是 rssParser 对象。我“刷新”了 XML 提要，它运行了该 block 并且发生了泄漏...... 文件.h @interface
iphone - NSFileManager 泄漏
我在我编写的以下代码片段中发现了内存泄漏 NSFileManager *fileManager=[[NSFileManager alloc] init]; fileList=[[fileManager
javascript - 一段时间后HTML5音频停止工作(泄漏)
因此，我正在开发HTML5 / javascript rts游戏。观察一直有几种声音在播放。因此，对我来说，是一段时间后声音听起来像是“崩溃”，并且此浏览器选项卡上的所有声音都停止了工作。我只能通过重
perl - 了解开发::泄漏
下面是我正在使用的一段代码及其输出。 my $handle; my $enterCount = Devel::Leak::NoteSV($handle); print "$date entry $en
Go goroutine 泄漏
在这篇关于 go-routines 泄漏的帖子之后，https://www.ardanlabs.com/blog/2018/11/goroutine-leaks-the-forgotten-sende
c - 执行后内存(泄漏)
我想知道为什么在执行 ./a.out 后随机得到以下结果。有什么想法我做错了吗？谢谢 http://img710.imageshack.us/img710/8708/trasht.png 最佳答案正
ios - 二维码扫描后内存峰值/泄漏
我正在 Swift 中开发一个应用程序，在呈现捕获我放在一起的二维码的自定义 ViewController 后，我注意到出现了巨大的内存跳跃。该代码本质上基于以下示例:http://www.appc
javascript - XMLHttpRequest 泄漏
下面是我的 javascript 代码片段。它没有按预期运行，请帮我解决这个问题。 function getCurrentLocation() { console.log("insi
java - 卡夫卡生产者巨大的内存使用(泄漏？)
我们在生产环境中部署了 3 个代理 Kafka 0.10.1.0。有些应用程序嵌入了 Kafka Producer，它们将应用程序日志发送到某个主题。该主题有 10 个分区，复制因子为 3。我们观察
iphone - appendFormat 泄漏
我正在使用仪器来检测一些泄漏，但有一些泄漏我无法解决； NSMutableString *textedetails = [[NSMutableString alloc] init];
ios - 性能工具 - 泄漏
如果我使用性能工具测试我的代码 - 泄漏，它没有检测到任何泄漏。这是否意味着代码没有泄漏任何内存？我有一个越狱的 iPhone，我可以监控可用内存。如果有人知道，那就是 SBSettings。我测试
ios - ABPersonCopyImageData 泄漏
我在从 AddressBook 中获取图像时遇到了很大的问题，下面我粘贴了我的代码。此 imageData 从未被释放，在我的 Allocations Instruments 上它看起来总是在内存中它
ios - class_copyIvarList 泄漏
- (NSMutableArray *)getArrayValue:(NSArray *)array{ NSMutableArray *valueArray = [NSMutableArra
读取字符串值时 iPhone 泄漏
Instruments 工具说这是一个泄漏，有什么想法吗？我在 for 循环结束时释放变量对象在上述方法的开头，这就是我设置变量对象的方式，即自动释放； NSMutableArray *varia
ios - 泄漏 CGImageMergeXMPPropsWhithLegacyProps
我正在跟踪我的 iOS 应用程序的内存泄漏，我有一个奇怪的泄漏导致我的应用程序崩溃......负责的框架是:CGImageMergeXMPPropsWhithLegacyProps。在某些时候，我的应
ios - NSOperationQueue 泄漏？
我正在尝试使用 NSOperationQueue 在后台线程中执行一个方法，如下所示: NSOperationQueue *queue = [NSOperationQueue new]; NS

首页

博学

6Ren·AI

商城

ruby-on-rails - 递归ruby方法中的明显内存泄漏