Javascript、Tesseract、AWS IoT、Dynamodb 和缓冲区-6ren

Javascript、Tesseract、AWS IoT、Dynamodb 和缓冲区

转载作者：行者123 更新时间：2023-11-28 03:48:05

25

4

我正在一个小型 Tesseract 项目上工作和测试，并完全归功于 http://aalvarez.me/blog/posts/building-an-ocr-service-with-tesseractjs-in-aws-lambda.html我有一个在 Lambda 中运行的 Tesseract 项目，它接受 s3 事件并处理上传到 s3 的图像。

下一个目标是处理来自 AWS IoT 的图像。主要障碍是您无法通过 MQTT 发送图像。

我的方法是在 MQTT 主题上发送图像的缓冲区/二进制流，然后 IoT 规则触发相同的 lambda 进行处理。

但是首先，我需要有一个有效的二进制流(还没有真正的硬件和摄像头，仅供引用，我是后端人员)通过 IoT 发送，所以我修改了我的项目，不仅存储在图像以及图像的二进制流/缓冲区。

我需要这样做，因为 AWS Cloudwatch 会 chop 日志记录，因此当我注销 Lambda 函数加载的 s3 对象的数据负载时，您得到的只是一个严重 chop 的缓冲区对象。

dataBody: <Buffer 89 50 4e 47 0d 0a 1a 0a 00 00 00 0d 49 48 44 52 00 00 01 90 00 00 01 90 08 06 00 00 00 80 bf 36 cc 00 00 20 00 49 44 41 54 78 5e ed 9d 09 f8 76 df 58 ... >

因此，我添加了一些代码，按照下面的方式使用 DynamoDB updateItem 和 SET 来设置数据库项上的属性，并使用用于执行 OCR 的原始缓冲区，如下所示

            "UpdateExpression": "SET img = :attrValue",
        "ExpressionAttributeValues": {
            ":attrValue": { "B": dataBody }

这有效，并且在带有一大串字符的项目中创建了属性，我认为这些字符是原始的，但可能采用了某种不同的格式

现在，如果我将这个大字符串作为 MQTT 有效负载发送并触发规则，那么 Lambda 就会触发，但是当我转换有效负载并尝试处理它时，Tesseract 会提示

类型错误:无法读取 null 的属性“mime”

该错误可能是将 IoT 有效负载转换为缓冲区进行处理的结果，因为在读取原始 s3 对象时，它现在与原始缓冲区完全不同，因此不存在 mime 属性。我正在选择的数据现在已被处理

let ocrBuffer = Buffer.from(iotEvent)

ocrBuffer: <Buffer 69 56 42 4f 52 77 30 4b 47 67 6f 41 41 41 41 4e 53 55 68 45 55 67 41 41 41 5a 41 41 41 41 47 51 43 41 59 41 41 41 43 41 76 7a 62 4d 41 41 41 67 41 45 ... >

对缓冲区和处理图像等有点新手，但我怀疑将其存储到 DynamoDB 的过程以某种方式改变了原始缓冲区或将其包装在某些东西中，因此我需要正确地取消更改/解开它，这样它就变成了与原始 Buffer 相同，以 89 而不是 69 开头。

有谁知道哪里出了问题以及应该从哪里开始寻找。

现在我可以将图像上传到 s3，并且我想以某种方式保存有效负载，以便我可以将其用作通过 IoT 服务使用的测试有效负载

谢谢标记

最佳答案

问题的症结似乎是来自 Tesseract 的这条消息:

类型错误:无法读取 null 的属性“mime”

这至少有一个明确的原因。当您将数据发送到 Tesseract 时，听起来您没有设置 Content-type http header 。

在 examples from Tesseract 看起来需要 Content-type header ，这很有意义，因为它需要知道您要发布到它的文件类型。

所以我认为这里的问题是您的 Lambda 函数如何将数据发布到 Tesseract，特别是它如何设置 Content-type 和 Content-Disposition header ？

尽管您的二进制数据可能存在问题，但我现在可能不会关注这一点，因为它似乎不是 Tesseract 提示的问题。

您可以尝试的一件事是使用curl将(本地)文件发布到Tesseract，非常简单。假设此方法可行，请将 HTTP 请求与您的 Lambda 函数生成的请求进行比较，然后从那里反向工作。我怀疑您没有内容问题，或者至少这可能不是当前的问题。

关于Javascript、Tesseract、AWS IoT、Dynamodb 和缓冲区，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/48272990/

25

4

0

文章推荐： javascript - 当内容达到一定大小时出现空白页

文章推荐： javascript - 使用 javascript 漂亮地打印 XML

文章推荐： javascript - 通过 Ajax 调用将 JSON 传递给 WCF

文章推荐： javascript - 切换汉堡下拉菜单 : How to call ancestor with JQuery?

aws-sdk - AWS SDK 与 AWS CLI - AWS 云形成 - Terraform
对于在 AWS 云中配置基础设施，我们目前使用从 ansible 角色调用的云形成模板，但我们发现在增加基础设施的规模后，此代码在 GitHub 中变得非结构化或未模块化 Github上有意大利面条式
aws-cloudformation - AWS Cloudformation 创建 AWS Cloudwatch 事件以触发 AWS Batch
我一直在阅读documentation for AWS Cloudwatch events至trigger AWS Batch我不知道如何从 cloudwatch 事件触发 aws 批处理: 在 aw
AWS EKS aws-load-balancer-controller(AWS EKS AWS-负载平衡器控制器)
我正在尝试使用入口控制器安装我的CA证书。我正在遵循这份指南。Https://docs.aws.amazon.com/eks/latest/userguide/aws-load-balancer-co
aws-cloudformation - 如何使用 aws cloudformation 或 aws cdk 设置 aws aurora mysql 表？
如何使用 aws cloudformation 或 aws cdk 设置 aws aurora mysql 表？在我的设置中，我有一个使用 lambda 实现各种微服务的无服务器应用程序。数据库是无
typescript - aws-cdk-lib vs @aws-cdk/core, @aws-cdk/aws-iam, ... 的目的是什么？
我看到了各种使用 AWS CDK 的示例，其中一些使用 aws-cdk-lib，另一些使用 @aws-cdk/core。这些之间有什么区别，什么时候应该使用一个或另一个？最佳答案 aws-cdk-l
typescript - aws-cdk-lib vs @aws-cdk/core, @aws-cdk/aws-iam, ... 的目的是什么？
我看到了各种使用 AWS CDK 的示例，其中一些使用 aws-cdk-lib，另一些使用 @aws-cdk/core。这些之间有什么区别，什么时候应该使用一个或另一个？最佳答案 aws-cdk-l
aws-lambda - AWS Lambda 是否支持 aws-sdk v3？
我在 cdk 研讨会上建立了一个小的 lambda 函数 here .我正在用 typescript 编写 lambda 函数，通过管道进行部署，该管道创建了一个包含 lambda 函数的云形成堆栈。
aws-lambda - 如何在 AWS lambda 中使用 AWS KMS
我刚刚开始使用 AWS 服务，尤其是 AWS Lambda。有没有办法从 Lambda 代码 (Java) 中使用 AWS KMS 服务。我想使用 KMS 来解密加密的外化(从属性读取) secret
aws-cloudformation - AWS CloudFormation - AWS::ElasticLoadBalancingV2::LoadBalancer - 安全组
CFN 模板是否可以根据参数向 ALB 添加一些特定的安全组？我遇到了两个安全组添加到 ALB 的情况: ALB Type: AWS::ElasticLoadBalancingV2::LoadB
security - 一个 AWS 账户上的 AWS 安全组可以引用另一个 AWS 账户上的安全组吗？
例如，我有一个主要公司 AWS 账户，其安全组为 xxxxx。现在我有了我的个人 aws 安全组-yyyyy。这些帐户根本不相关。我可以将接受组-yyyyy 添加到组-xxxxx 中，从而允许我的
aws-lambda - AWS Lambda 的 AWS MSK 触发器 - 同一执行上下文中的多个主题
我有一个 Lambda 函数，它有多个 MSK 触发器配置 - 每个都针对不同的主题。如果 Lambda 的输入 ( MSKEvent ) 可以包含多个不同的主题，则未在官方文档中找到任何信息。官
aws-glue - 来自 AWS secret 管理器的 AWS Glue 连接
在 AWS Glue 中创建 JDBC 连接时，有什么方法可以从 AWS secret manager 获取密码而不是手动硬编码吗？最佳答案我必须在我当前的项目中这样做才能连接到 Cassandr
aws-appsync - : aws-sdk/clients/appsync and aws-appsync?有什么区别
谁能告诉我: aws-sdk/clients/appsync , 和 aws-appsync 根据文档，aws-sdk/clients/appsync使用是因为只包括 aws-sdk当我们只需要 ap
aws-amplify - 如何将现有的 AWS Amplify 后端导入本地的空 AWS Amplify 项目？
我不小心删除了我的放大前端并创建了一个新前端。如何将现有的放大后端导入新创建的放大应用项目文件夹？我按照后端标签上的步骤操作 amplify init --appId(“您的新AMPLIFY APP
aws-glue - 如何使用 AWS java SDK 使用 AWS 胶水作业自动生成脚本
我正在使用 Java Sdk 创建粘合作业。它只有两个必需的参数 Command 和 Glue 版本。但我需要使用自动脚本生成来创建工作。正如我们可以从控制台做的那样，我们添加数据源、AWS Glu
aws-lambda - 有没有办法在 AWS Glue 作业结束时触发 AWS Lambda 函数？
目前我正在使用 AWS Glue 作业将数据加载到 RedShift，但在加载之后我需要运行一些可能使用 AWS Lambda 函数的数据清理任务。有没有办法在 Glue 作业结束时触发 Lambda
aws-lambda - AWS lambda 和 AWS Lambda@EDGE 之间有什么区别？
简单的 aws lambda 和 aws lambda@edge 有什么区别？最佳答案 Lambda 根据某些触发器执行函数。 Lambda 的用例非常广泛，并且与许多 AWS 服务高度集成。您甚至
ruby-on-rails - AWS OpsWorks、AWS Beanstalk 与 AWS CloudFormation？
关闭。这个问题是opinion-based 。目前不接受答案。想要改进这个问题吗？更新问题，以便 editing this post 可以用事实和引文来回答它。 . 已关闭 9 个月前。社区 9
aws-cdk - 无法使用 python 使用 AWS-CDK 创建 AWS 管理的事件目录
我正在尝试使用 Python 使用 AWS-CDK 创建托管广告。以下是错误，从 JavaScriptError(resp.stack) 引发 JSIIError(resp.error)jsii.er
javascript - @aws-cdk/pipelines 和 @aws-cdk/aws-codepipeline 有什么区别？
这两个包似乎在很大程度上做同样的事情？这两个包之间的预期区别是什么，我应该使用哪个包？最佳答案 Pipelines 是较新的 --experimental-- (编辑:它不再在 Experiment

首页

博学

6Ren·AI

商城

Javascript、Tesseract、AWS IoT、Dynamodb 和缓冲区