Python 生成用于 S3 上传的 AWS CLI 进程，但它变得非常慢-6ren

Python 生成用于 S3 上传的 AWS CLI 进程，但它变得非常慢

转载作者：太空宇宙更新时间：2023-11-03 15:42:10

25

4

我的 Python 应用程序为 AWS CLI S3 上传创建一个子进程。

command = 'aws s3 sync /tmp/tmp_dir s3://mybucket/tmp_dir'
# spawn the process
sp = subprocess.Popen(
    shlex.split(str(command)),
    stdout=subprocess.PIPE, stderr=subprocess.PIPE)
# wait for a while
sp.wait()
out, err = sp.communicate()

if sp.returncode == 0:
    logger.info("aws return code: %s", sp.returncode)
    logger.info("aws cli stdout `{}`".format(out))
    return

# handle error

/tmp/tmp_dir 大小约为 0.5Gb，包含约 100 个文件。上传过程大约需要 25 分钟，速度非常慢。

如果我直接运行 AWS 命令(不使用 Python)，则需要不到 1 分钟。

怎么了？任何帮助表示赞赏。

最佳答案

我注意到文档中关于 wait() 使用的警告(见下文)。然而，与其调试它，为什么不重写它以使用 Python SDK，而不是使用 aws cli 进行 shell 操作呢？也许您会获得更好的性能和更清晰的代码。

https://boto3.readthedocs.io/en/latest/guide/s3.html

Warning This will deadlock when using stdout=PIPE and/or stderr=PIPE and the child process generates enough output to a pipe such that it blocks waiting for the OS pipe buffer to accept more data. Use communicate() to avoid that.

https://docs.python.org/2/library/subprocess.html

编辑3:

这是我刚刚测试过的解决方案，它运行时不会阻塞。有一些在底层使用 wait() 或 communications() 的便捷方法，它们更容易使用，例如 check_output:

#!/usr/bin/env python
import subprocess
from subprocess import CalledProcessError

command = ['aws','s3','sync','/tmp/test-sync','s3://bucket-name/test-sync']
try:
    result = subprocess.check_output(command)
    print(result)
except CalledProcessError as err:
    # handle error, check err.returncode which is nonzero.
    pass

关于Python 生成用于 S3 上传的 AWS CLI 进程，但它变得非常慢，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/42032217/

25

4

0

文章推荐： python - 获取许多一维数组的特征值的最快方法

文章推荐： Python Django 名称错误 : name 'datetime' is not defined

angular-cli - 您必须位于 Angular-CLI 项目中才能在重新安装 Angular-CLI 后使用构建命令
我在全局范围内安装了最新的 angular-cli，并且我的项目正在成功构建。在阅读另一个问题的建议解决方案时，(https://github.com/angular/angular-cli/iss
javascript - 如何使用@angular/cli(angular-cli、ng cli)定义webpack入口文件？
根据official docs关于 .angular-cli.json 配置文件，仅支持 main、test、polyfills 作为 webpack 入口文件。如何通过定义 .angular-cl
aws-cli - 用于在s3存储桶中搜索文件的AWS CLI
我想在s3存储桶中搜索文件名abc.zip，并且有将近60个存储桶，每个存储桶都有2到3个级别的子目录或文件夹。我尝试使用AWS CLI命令执行搜索，以下是我尝试过的命令，但即使文件存在于存储桶中，也
c++-cli - CLI 中的复制构造函数和赋值运算符
我正在尝试在 C++/CLI 中查找赋值运算符和复制构造函数的示例。我在 Google 上花了很多时间，但令人惊讶的是我找不到一个看起来很常见的例子。最佳答案 .NET 语义没有复制构造函数或赋值运
c++-cli - CLI/C++ 如何获取窗口句柄？
我需要获取另一个窗口的句柄。这是它的代码: private: System::Void btn_find_Click(System::Object^ sender, System::EventAr
c++-cli - C++/CLI 社区
有点好奇实际上有多少人使用 C++/CLI？那么有多少人在使用它呢？人们是否只在托管环境下寻找程序员的特定工作？围绕 c++/cli 的社区有多大？从我目前看到的情况来看，有不少语法变化，作为 C++
c++-cli - C++/CLI 中的文字字段与常量变量
我正在阅读一些 C++/CLI Material ，并且遇到了文字字段的概念: literal int inchesPerFoot = 12; 这是否比 const 更可取，因为 const FIEL
angular-cli - Angular CLI 安装失败
通过 npm install -g angular-cli@latest 安装 Angular CLI (angular-cli@1.0.0-beta.16) 失败，出现以下错误 npm-debug.
ember-cli - Ember CLI 应用程序中基于环境的主机
我正在尝试在我的 Ember CLI 应用程序中配置适配器以根据环境使用不同的主机。在开发中，我希望它是默认的当前主机(让我通过 --proxy 选项自定义它，但在生产中我知道它将是 http://s
angular-cli - Angular/CLI -- 不会自动重新加载
我最近开始使用 Angular/CLI 工具，我在执行文件时遇到了一个问题，那就是我运行时 ng serve 那么这个命令可以帮助我们在源文件中进行任何更改时自动重新加载站点，但在我的系统中它没有发生
c++-cli - c++/cli 包装问题
是否有推荐的方法通过 c++ cli 包装 native c++ 库？最佳答案不确定是否一种尺寸适合所有人，但是，是的，这很大程度上是一个机械过程。您的 ref 类包装器应该声明一个私有(priv
c++-cli - C++ CLI 包装器
我有一个关于为要在 C# 中使用的 native C++ 类创建 C++ CLI 包装器的问题。这是一个示例代码: #include "stdafx.h" #pragma once using na
c++-cli - C++/CLI 二维数组分配失败
下面的代码打印 0 和 3。这是代码生成错误吗？我在 .NET 4.0 下使用 Visual Studio 2012 Update 3 RC 运行它 #include "stdafx.h" using
c++-cli - c++/cli 如何在内部与非托管部分一起工作？
它是如何工作的？它是否有不同的部分 - 有些方法是托管的，有些是非托管的，它是否将每个方法都转换为托管的，试图保持所有东西都处于托管状态并在必须时进行互操作调用？最佳答案三种不同的compiler
c++-cli - C++/CLI 哪个类包含全局函数？
如果我没记错的话，函数必须是 CLR 世界中类的成员，而全局函数在 C++/CLI 中是可能的。这是否意味着这些全局函数是某种隐藏的“全局”类的一部分？如果是这样，出于反射目的，人们将如何获取其类型？
angular-cli - Angular Cli - 如何重建我的项目
如何在 Angular 中重建我的项目。我首先使用 ng build 构建它，但无法再次执行该命令，因为它不会让我更改文件夹。我收到此错误消息: EPERM:不允许操作，lstat 是否有另一个命令
CLI 类的 C++/CLI 循环引用问题
我遇到了两个相互引用的类的问题。我曾尝试使用接口(interface)来解决问题，但遇到了其他问题，例如类重新定义。我只是不确定如何正确执行此操作。这是我正在做的事情的一个例子。注意:我已经去掉了所
javascript - CLI 移至单独的包 : webpack-cli
我是 React.js 的新手，我正在尝试从 tutorialspoint 上的教程中学习但我遇到了错误。这是我执行 npm start 命令时控制台上的错误: C:\Users\HP\Desktop
angular - ng update @angular/cli @angular/core 或 npx @angular/cli@13 update @angular/core@13 @angular/cli@13 不工作
我正在尝试将我的 angular cli 和 angular core 从 12 升级到 13，但看起来存在对等依赖性问题。有人遇到过这个问题吗？ npx @angular/cli@13 update
influxdb - Influx CLI 快把我逼疯了，无法打开 CLI
我正在我的 ubuntu 上安装 influxdb_2.0.9，我按照这里的说明操作: https://docs.influxdata.com/influxdb/v2.0/install/?t=Lin

首页

博学

6Ren·AI

商城

Python 生成用于 S3 上传的 AWS CLI 进程，但它变得非常慢