google-app-engine - 在 Google App Engine 中，如何在将文件写入 blobstore 而不是超过软内存限制时减少内存消耗？-6ren

google-app-engine - 在 Google App Engine 中，如何在将文件写入 blobstore 而不是超过软内存限制时减少内存消耗？

转载作者：太空宇宙更新时间：2023-11-03 15:20:12

我正在使用 blobstore 以 csv 格式备份和恢复实体。这个过程对我所有的小模型都很有效。但是，一旦我开始处理实体超过 2K 的模型，就会超出软内存限制。我一次只获取 50 个实体，然后将结果写入 blobstore，所以我不清楚为什么我的内存使用量会增加。我可以通过增加下面传递的“限制”值来可靠地使该方法失败，这会导致该方法运行的时间稍长一些，以导出更多实体。

关于如何优化此过程以减少内存消耗的任何建议？
此外，生成的文件大小将只有 <500KB。为什么该进程会使用 140 MB 内存？

简化示例:

file_name = files.blobstore.create(mime_type='application/octet-stream')
with files.open(file_name, 'a') as f:
    writer = csv.DictWriter(f, fieldnames=properties)
    for entity in models.Player.all():
      row = backup.get_dict_for_entity(entity)
      writer.writerow(row)

产生错误:在为总共 7 个请求提供服务后，超过 150.957 MB 的软专用内存限制

简化示例 2:

问题似乎与在 python 2.5 中使用文件和 with 语句有关。排除 csv 内容，我可以通过简单地尝试将 4000 行文本文件写入 blobstore 来重现几乎相同的错误。

from __future__ import with_statement
from google.appengine.api import files
from google.appengine.ext.blobstore import blobstore
file_name = files.blobstore.create(mime_type='application/octet-stream')   
myBuffer = StringIO.StringIO()

#Put 4000 lines of text in myBuffer

with files.open(file_name, 'a') as f:
    for line in myBuffer.getvalue().splitlies():
        f.write(line)

files.finalize(file_name)  
blob_key = files.blobstore.get_blob_key(file_name)

产生错误:在为总共 24 个请求提供服务后，超过了 154.977 MB 的软专用内存限制

原文:

def backup_model_to_blobstore(model, limit=None, batch_size=None):
    file_name = files.blobstore.create(mime_type='application/octet-stream')
    # Open the file and write to it
    with files.open(file_name, 'a') as f:
      #Get the fieldnames for the csv file.
      query = model.all().fetch(1)
      entity = query[0]
      properties = entity.__class__.properties()
      #Add ID as a property
      properties['ID'] = entity.key().id()

      #For debugging rather than try and catch
      if True:
        writer = csv.DictWriter(f, fieldnames=properties)
        #Write out a header row
        headers = dict( (n,n) for n in properties )
        writer.writerow(headers)

        numBatches = int(limit/batch_size)
        if numBatches == 0:
            numBatches = 1

        for x in range(numBatches):
          logging.info("************** querying with offset %s and limit %s", x*batch_size, batch_size)
          query = model.all().fetch(limit=batch_size, offset=x*batch_size)
          for entity in query:
            #This just returns a small dictionary with the key-value pairs
            row = get_dict_for_entity(entity)
            #write out a row for each entity.
            writer.writerow(row)

    # Finalize the file. Do this before attempting to read it.
    files.finalize(file_name)

    blob_key = files.blobstore.get_blob_key(file_name)
    return blob_key

错误在日志中看起来像这样

......
2012-02-02 21:59:19.063
************** querying with offset 2050 and limit 50
I 2012-02-02 21:59:20.076
************** querying with offset 2100 and limit 50
I 2012-02-02 21:59:20.781
************** querying with offset 2150 and limit 50
I 2012-02-02 21:59:21.508
Exception for: Chris (202.161.57.167)

err:
Traceback (most recent call last):
  .....
    blob_key = backup_model_to_blobstore(model, limit=limit, batch_size=batch_size)
  File "/base/data/home/apps/singpath/163.356548765202135434/singpath/backup.py", line 125, in backup_model_to_blobstore
    writer.writerow(row)
  File "/base/python_runtime/python_lib/versions/1/google/appengine/api/files/file.py", line 281, in __exit__
    self.close()
  File "/base/python_runtime/python_lib/versions/1/google/appengine/api/files/file.py", line 275, in close
    self._make_rpc_call_with_retry('Close', request, response)
  File "/base/python_runtime/python_lib/versions/1/google/appengine/api/files/file.py", line 388, in _make_rpc_call_with_retry
    _make_call(method, request, response)
  File "/base/python_runtime/python_lib/versions/1/google/appengine/api/files/file.py", line 236, in _make_call
    _raise_app_error(e)
  File "/base/python_runtime/python_lib/versions/1/google/appengine/api/files/file.py", line 179, in _raise_app_error
    raise FileNotOpenedError()
FileNotOpenedError

C 2012-02-02 21:59:23.009
Exceeded soft private memory limit with 149.426 MB after servicing 14 requests total

最佳答案

最好不要自己进行批处理，而只是遍历查询。迭代器将选择一个应该足够的批量大小(可能是 20):

q = model.all()
for entity in q:
    row = get_dict_for_entity(entity)
    writer.writerow(row)

这避免了重新运行具有不断增加的偏移量的查询，这很慢并且会导致数据存储中的二次行为。

关于内存使用的一个经常被忽视的事实是，与实体的序列化形式相比，实体的内存中表示可以使用 30-50 倍的 RAM；例如磁盘上 3KB 的实体可能会使用 100KB 的 RAM。 (确切的膨胀系数取决于许多因素；如果您有很多名称很长而值很小的属性，情况会更糟，对于重复的名称很长的属性，情况更糟。)

关于google-app-engine - 在 Google App Engine 中，如何在将文件写入 blobstore 而不是超过软内存限制时减少内存消耗？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/9124398/

文章推荐： python - 使用 pynotify 读取新行

文章推荐： google-app-engine - 未找到 Google 云打印 OAuth 范围

node.js - MAC OS X "open APP.app"和 "APP.app/content/MacOs/APP"shell 脚本之间的差异
如果我调用一个应用程序两次或多次，但只有一个实例应该运行(这是所需的)，我就会遇到一个问题。首先一些(可能必要的)背景信息: 使用 MAC OS X El Capitan (10.11.6) 我有一
google-apps-script - 使用 Apps 脚本代码用另一个 Apps 脚本文件更新(覆盖)一个 Apps 脚本文件
覆盖文件。覆盖 Apps 脚本文件。这是不是创建一个新的 Apps 脚本文件的问题。那对我没有帮助。我需要更新现有的 Apps 脚本文件。这个问题类似于创建一个新文件，但不是同一个问题。更新的语
google-apps-script - 从另一个 Apps Script 项目运行 Apps Script Web App 时如何以编程方式进行身份验证
我是 Apps 脚本的新手，正在尝试了解使用另一个帐户在一个帐户中运行/触发脚本的基础知识。需要注意的是:我想在访问脚本的用户而不是拥有脚本的用户的情况下运行脚本——以便将运行时间分配给访问的用户。
google-apps-script - 从另一个 Apps Script 项目运行 Apps Script Web App 时如何以编程方式进行身份验证
我是 Apps 脚本的新手，正在尝试了解使用另一个帐户在一个帐户中运行/触发脚本的基础知识。需要注意的是:我想在访问脚本的用户而不是拥有脚本的用户的情况下运行脚本——以便将运行时间分配给访问的用户。
android - APP URI for app Indexing an android app
我有一个安卓应用程序。我想为我的应用程序实现 App Indexing。我已经点击了 Google 开发者链接 https://developers.google.com/app-indexing/
javascript - import App from '../components/App' 有什么区别？和 var App = require ('../components/App' );?
有什么区别: import App from '../components/App'; 和 var App = require('../components/App'); 两者都用于获取组件，但它没有
javascript - RequireJS 搜索 app.app 而不是 app.js(其中 app.js 是 data-main 中指定的入口点)
问题: 我有一个使用 requireJS 的简单演示应用程序。当require.min.js脚本加载时，它尝试加载入口点脚本。但是，问题是，而不是 localhost:8090/js/app.js它尝
android - React-Native: "FirebaseError: No Firebase App ' [默认 ]' has been created - call Firebase App.initializeApp() (app/no-app)"
我正在构建一个 React Native 应用程序，目前正在尝试通过 Firebase Auth 实现一个身份验证注册系统。我已经按照指南/网站上的文档来设置 Firebase 配置文件。我运行该应用
google-app-engine - Google App Engine app.yaml 网址映射
因此 app.yaml 文件的一部分如下所示(至少在 GAE 教程中): handlers: - url: /.* script: main.app 但是，我也看到它看起来像这样: handler
android - 信息:Gradle任务[:app:generateDebugSources，:app:generateDebugAndroidTestSources，:app:createMockableJar]
我是Android App开发的新手。当我尝试创建一个新项目Android Project时，弹出以下消息: Information:Gradle tasks [:app:generateDebugS
google-apps-script - Google App Script Web App 上的并发点击或同时执行的数量是否有限制
我正在编写一个应用程序脚本(用于处理电子邮件、任务和日历事件)并希望将其部署为网络应用程序。该应用程序将在运行它的用户的上下文中运行。该应用程序将被超过 10k+ 的用户使用，甚至可能更多。在将其
google-apps-script - Google Apps Script Web App 在外部网站上进行身份验证
我需要实现一个用于登录网站的 Google Apps 脚本应用，然后如果该网站上的身份验证过程成功，用户应该会在 google 脚本边栏中收到一条消息。例如:用户输入他的邮箱和密码，然后他点击登录按
android - 如何在iOS App 中使用Google In-App Purchase 系统使用在Android App 中购买的数字项目？
我正在开发一个跨平台应用程序，它将在 Google Play 商店和 App Store 上发布。 Google Play 政策以及 App Store 政策规定，您不能使用其他支付系统购买将在应用程
google-app-engine - App Engine 忽略我的源代码更新和我的 app.yaml 文件
我的 AppEngine 应用程序在我的台式机上的开发服务器上运行良好，但我无法在 Google 服务器上获取版本以关注我的源代码更新。这是最有说服力的例证。我的 app.yaml 文件开始于: a
google-app-engine - 上传属性 Google App Engine - app.yaml
我像这样将所有内容重定向到我的 app.yaml 中的单个文件 - url: /.* script: frontcontroller.application 但我仍然必须使用 robots.txt
google-app-engine - Google App Engine : one app, 多个域
我想构建一个基于 App Engine 的网络应用程序，并使用 Google 帐户对用户进行身份验证。我需要来自多个域的用户可以登录。从我读到的内容看来，仅使用 Google Accounts API
google-app-engine - Google Apps 域上的 Google App Engine
我无法将我的域指向我使用 Google App Engine 托管的网站。这是背景……注意区分“google apps”(域托管、电子邮件等)和“google app engine”(网站框架)的概念
google-app-engine - 使用 Google Apps + App Engine 进行单点登录
是否可以通过 App Engine 上内置的 OpenId 实现单点登录？我一直在尝试集成一个 Marketplace 应用程序，并让用户在来自 Google Apps(管理面板或通用导航)时登录。我
azure-web-app-service - 从 azure-cli 向 Web App 或 Function App 添加 App Insights 支持
有没有办法从 azure-cli 为 Web 应用或函数应用创建和/或激活 App Insights？现在浏览文档。最佳答案我之前也考虑过你的问题。要创建应用程序洞察力，az resource
angular - ng new hello 错误 : Path "/app/app.module.ts" does not exist. 路径 "/app/app.module.ts"不存在
我在以 Angular 创建新项目时遇到问题。当我运行 ng new myapp 命令时，我得到以下命令 ng 新问候语 Error: Path "/app/app.module.ts" does n

太空宇宙

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

google-app-engine - 在 Google App Engine 中，如何在将文件写入 blobstore 而不是超过软内存限制时减少内存消耗？

原文: