python - AWS Lambda : read csv file dimensions from an s3 bucket with Python without using Pandas or CSV package-6ren

python - AWS Lambda : read csv file dimensions from an s3 bucket with Python without using Pandas or CSV package

转载作者：行者123 更新时间：2023-12-01 01:08:59

26

4

下午好。我希望有人可以帮助我解决这个问题。

我的 s3 文件夹中有多个 CSV 文件。我想使用没有 Pandas 的 python 和 csv 包(因为 aws lambda 的可用包非常有限，并且有大小限制)并循环遍历 s3 存储桶中的文件，并读取 csv 尺寸(长度行和列的长度)

例如，我的 s3 文件夹包含两个 csv 文件(1.csv 和 2 .csv)我的代码将运行指定的 s3 文件夹，并将行数和列数放入 1 个 csv 和 2 个 csv 中，并将结果放入新的 csv 文件中。我非常感谢你的帮助!我可以使用 Pandas 包来做到这一点(感谢上帝，Pandas，但是 aws lambda 有限制，限制了我可以使用的内容)

AWS lambda 使用 python 3.7

最佳答案

如果您可以在 lambda 函数中访问 s3 资源，那么基本上这样做是为了检查行，

def lambda_handler(event, context):
    import boto3 as bt3
    s3 = bt3.client('s3')
    csv1_data = s3.get_object(Bucket='the_s3_bucket', Key='1.csv')
    csv2_data = s3.get_object(Bucket='the_s3_bucket', Key='2.csv')

    contents_1 = csv1_data['Body'].read()
    contents_2 = csv2_data['Body'].read()
    rows1 = contents_1.split()
    rows2=contents_2.split()    
    return len(rows1), len(rows2)

它应该可以直接运行，如果不能，请告诉我。顺便说一句，像我在示例中所做的那样将存储桶和文件名硬编码到函数中根本不是一个好主意。

问候。

关于python - AWS Lambda : read csv file dimensions from an s3 bucket with Python without using Pandas or CSV package，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/55035518/

26

4

0

文章推荐： python - 将函数应用于一系列特定行

文章推荐： javascript - 将表单数据发送到 firebase 函数

文章推荐： python - 在Python中发送电子邮件(MIMEmultipart)

ssl - Bucket SSL/Bucket 的高额账单？ - 谷歌云
我正在通过 Google Bucket 托管一个简单的静态网站，请注意:比尔看起来很眼熟吗？我对高使用率感到惊讶。是否存在用于 GoogleBucket 网站的 Hitcounter？如何使用 S
Couchbase buckets vs Ephemeral buckets(沙发底座桶与Ephemeral桶)
Couchbase存储桶是否也将数据存储在内存中？我想使用Couchbase存储桶创建实时排行榜系统，并运行四个不同的查询：。1-选择现有排名2-如果存在更新排名(排名+1)3-插入排名和更多数据，如
Couchbase buckets vs Ephemeral buckets(沙发桶VS短暂桶)
Couchbase存储桶是否也将数据存储在内存中？我想使用Couchbase存储桶创建实时排行榜系统，并运行四个不同的查询：。1-选择现有排名2-如果存在更新排名(排名+1)3-插入排名和更多数据，如
ElasticSearch:获取 bucket scripted_metric 中的 bucket key
我正在尝试在 elasticsearch 中运行此查询。我正在尝试在我的存储桶上运行自定义 scripted_metric 聚合。在指标脚本中，我想访问聚合它的存储桶 key 。我在 ES 中的文档
hadoop - Hive Buckets——理解TABLESAMPLE(BUCKET X OUT OF Y)
您好，我是 Hive 的新手，我已经了解了 hadoop 中的桶概念，但未能理解以下几行。有人可以帮助我吗？ SELECT avg(viewTime) FROM page_view TABLESAM
hadoop - Impala 是否在 Hive Bucketed 表中有效使用 Buckets？
我正在改进表格的性能。说这个表: CREATE TABLE user_info_bucketed(user_id BIGINT, firstname STRING, lastname STRING)
android - App Standby Buckets - "Never"bucket有什么限制(bucket 50)
Android documentation提到操作系统对以下每个存储桶的应用程序施加的限制:“Activity ”、“工作集”、“频繁”和“稀有”。唯一documentation我发现“从不”存储桶
hadoop - Hive Bucketing - 如何为特定的 bucket 运行 hive 查询
我有一个配置单元查询，它读取 5 个大表并将记录输出到下一个进程。所有这些表都在 proc_dt 上分区并在 user_id 上分桶(5 个桶)。联接在 user_id 上完成，过滤在 proc_dt
symfony - SonataMediaBundle - S3 AWS : 'The configured bucket "my-bucket"does not exist
我正在尝试在我的 Sonata 项目上配置 AWS s3 文件系统，但我总是收到以下错误: The configured bucket "my-bucket" does not exist. 我的 s
python - 从 Google Cloud Storage Bucket 复制到 S3 Bucket
我已经设置了一个 airflow 工作流，将一些文件从 s3 提取到 Google Cloud 存储，然后运行 sql 查询工作流以在 Big Query 上创建新表。在工作流程结束时，我需要将最
amazon-web-services - AWS CDK 错误 : bucket policy already exists on bucket
我正在尝试在 Java 中使用 CDK 创建一个 lambda 和一个 DynamoDB。当我尝试执行“CDK 部署”时，我遇到以下错误: 11:20:30 AM | CREATE_FAILED
java - AWS Lambda : How to extract a tgz file in a S3 bucket and put it in another S3 bucket
我有一个名为“Source”的 S3 存储桶。许多“.tgz”文件被实时推送到该存储桶中。我编写了一个 Java 代码来提取“.tgz”文件并将其推送到“目标”存储桶中。我将代码作为 Lambda 函
google-cloud-platform - GCloud Storage : How to grant permission to see buckets in console but only see files in single bucket?
好的，这使我无法忍受，真是太复杂了…… 因此，要达到主题的目的，而又不授予用户对所有存储桶中所有文件的读取权限(proj中的其他存储桶都具有敏感数据) 我导航到存储桶->权限，并将用户添加为Stora
google-cloud-platform - 尝试从 Google Bucket 托管静态网站时出现 "Access denied: Anonymous users does not have storage.objects.list access to bucket"
我正在尝试按照 https://cloud.google.com/storage/docs/hosting-static-website 上的说明进行操作从 Google Bucket 托管静态网站。
amazon-web-services - AWS CloudTrail Create API for Go SDK 抛出错误消息 "InsufficientS3BucketPolicyException: Incorrect S3 bucket policy is detected for bucket: "
我正在尝试使用 Go SDK 创建一个 cloudtrail。按照 AWS 文档成功连接 AWS，没有任何问题。我按照以下步骤创建跟踪第 1 步 - 创建 S3 存储桶，以便所有跟踪日志文件都可以
哈希表 : why buckets?
据我所知，散列函数的目的是尽可能均匀地分发数据，当您发生冲突时，您有多种选择: 寻找下一个空槽生成不同的散列并尝试将其粘贴到其他地方把它放在一个溢出容器中(可以是一个列表、另一个哈希表或其他任何东
bucket - 漏桶问题有帮助吗？
我正在努力复习我的期末考试，我正在复习我的教授给我的示例问题。谁能向我解释漏桶如何工作的概念。另外，这是我的教授给我的关于漏桶的复习问题。一个漏桶位于主机网络接口(interface)。网络中的数据
php - 如何直接从url上传文件到S3 bucket
我从我的用户那里收到了一些彩信。这些彩信是通过 twilio 发送的。所以 twilio 将这些文件存储到他们的服务器中，我可以从 twilio 访问这些文件。但就我而言，我需要将这些文件存储到 S3
php - 如何直接从url上传文件到S3 bucket
我从我的用户那里收到了一些彩信。这些彩信是通过 twilio 发送的。所以 twilio 将这些文件存储到他们的服务器中，我可以从 twilio 访问这些文件。但就我而言，我需要将这些文件存储到 S3
c# - 如何将一个集合分成不同的 "buckets"
我有一组 C# 对象。对于数据成员，每个对象都有一个 guid 字符串、一个 int 索引和一个文档名称字符串。这是一个典型的集合的样子: "guid1","c:\temp\doc1.docx",1

首页

博学

6Ren·AI

商城

python - AWS Lambda : read csv file dimensions from an s3 bucket with Python without using Pandas or CSV package