javascript - Azure 计算机视觉 : Recognize Printed Text-6ren

javascript - Azure 计算机视觉 : Recognize Printed Text

转载作者：行者123 更新时间：2023-12-03 03:43:39

我正在使用 Azure 计算机视觉和 Nodejs，我想提取图像上的文本，它按预期工作，但我面临一些挑战:代码:

'use strict';



const request = require('request');




const subscriptionKey = 'key';

const endpoint = 'endpoint'



var uriBase = endpoint + 'vision/v3.1/ocr';



const imageUrl = 'https://livesimply.me/wp-content/uploads/2015/09/foods-to-avoid-real-food-3036-2-1024x683.jpg';



// Request parameters.

const params = {

'language': 'unk',

'detectOrientation': 'true',

};



const options = {

uri: uriBase,

qs: params,

body: '{"url": ' + '"' + imageUrl + '"}',

headers: {

    'Content-Type': 'application/json',

    'Ocp-Apim-Subscription-Key' : subscriptionKey

}

};



request.post(options, (error, response, body) => {

if (error) {

console.log('Error: ', error);

return;

}

let jsonResponse = JSON.stringify(JSON.parse(body), null, '  ');

console.log('JSON Response\n');

console.log(jsonResponse);

});

输出:

"regions": [

{

  "boundingBox": "0,191,277,281",

  "lines": [

    {

      "boundingBox": "53,191,23,49",

      "words": [

        {

          "boundingBox": "53,191,23,49",

          "text": "in"

        }

      ]

    },

    {

      "boundingBox": "0,285,277,82",

      "words": [

        {

          "boundingBox": "0,285,150,82",

          "text": ")arb.0g"

        },

        {

          "boundingBox": "214,288,63,63",

          "text": "0%"

        }

      ]

    },

    {

      "boundingBox": "14,393,45,79",

      "words": [

        {

          "boundingBox": "14,393,45,79",

          "text": "Og"

        }

      ]

    },

    {

      "boundingBox": "213,394,63,63",

      "words": [

        {

          "boundingBox": "213,394,63,63",

          "text": "00/0"

        }

      ]

    }

  ]

},

{

  "boundingBox": "322,184,352,457",

  "lines": [

    {

      "boundingBox": "326,184,348,54",

      "words": [

        {

          "boundingBox": "326,184,239,52",

          "text": "INGREDIENTS:"

        },

        {

          "boundingBox": "588,188,86,50",

          "text": "WHITE"

        }

      ]

    },

    {

      "boundingBox": "325,248,281,59",

      "words": [

        {

          "boundingBox": "325,248,83,56",

          "text": "TUNA,"

        },

        {

          "boundingBox": "417,250,127,51",

          "text": "SOYBEAN"

        },

        {

          "boundingBox": "555,252,51,55",

          "text": "OIL,"

        }

      ]

    },

    {

      "boundingBox": "324,313,341,60",

      "words": [

        {

          "boundingBox": "324,313,155,52",

          "text": "VEGETABLE"

        },

        {

          "boundingBox": "489,316,101,56",

          "text": "BROTH,"

        },

        {

          "boundingBox": "598,317,67,56",

          "text": "SALT,"

        }

      ]

    },

    {

      "boundingBox": "324,378,334,53",

      "words": [

        {

          "boundingBox": "324,378,235,52",

          "text": "PYROPHOSPHATE"

        },

        {

          "boundingBox": "566,381,92,50",

          "text": "ADDED"

        }

      ]

    },

    {

      "boundingBox": "323,519,248,52",

      "words": [

        {

          "boundingBox": "323,519,193,51",

          "text": "DISTRIBUTED"

        },

        {

          "boundingBox": "528,521,43,50",

          "text": "BY:"

        }

      ]

    },

    {

      "boundingBox": "322,584,298,57",

      "words": [

        {

          "boundingBox": "322,584,124,50",

          "text": "BUMBLE"

        },

        {

          "boundingBox": "457,585,52,50",

          "text": "BEE"

        },

        {

          "boundingBox": "519,585,101,56",

          "text": "FOODS,"

        }

      ]

    }

  ]

},

{

  "boundingBox": "791,400,198,117",

  "lines": [

    {

      "boundingBox": "921,400,68,45",

      "words": [

        {

          "boundingBox": "921,400,68,45",

          "text": ",11."

        }

      ]

    },

    {

      "boundingBox": "791,464,128,53",

      "words": [

        {

          "boundingBox": "791,464,75,53",

          "text": "PRC:"

        },

        {

          "boundingBox": "874,467,45,48",

          "text": "x"

        }

      ]

    }

  ]

}

  ]

  }

但是我在使用这段代码时遇到了一些挑战:

我希望输出为字符串而不是 JSON 树。
我想只提取成分，而不是所有文本。
在某些情况下，图像可能包含成分但未指定成分关键字，在这种情况下如何提取成分？

图片:

感谢各位专家的帮助。

最佳答案

我们使用计算机视觉 REST API 通过光学字符识别 (OCR) 从图像中提取打印文本。成功的响应会以 JSON 格式返回。您无法从此 Azure 认知服务获取直接字符串输出。

对于问题-

I want the output as a string and not JSON tree.

我们无法像图中所示的字符串一样直接打印成分。要提取内容并以特定格式显示它，在获取 JSON 字符串后，将其解析为 JSON 对象并运行循环以从中提取数据。之后使用 split 函数将数据存储到数组中。如下面的代码片段所示。

function(error, response, body){
    if(error) {
        console.log(error);
    } else {
        //parsing the JSON string
        var jsonObj = JSON.parse(body);

        var ob = jsonObj;
        //running loop to extract the text values
            for(i=0;i<....){
                for(j=0;j<....){
                    for(k=0;k<....){
                         var str = str + " "+ob.....text;
                    }
                    str = str + "\n";
                }
            }
          var arr = str.split("\n");

根据您获得的 JSON 结构放置您的逻辑。

对于你的第二个问题和第三个问题 -

I would like to extract just the ingredients and not the all text.

In some cases the images may have ingredients without specifying the ingredient key-word, how can I extract the ingredients in this case ?

计算机视觉将从图像中提取所有打印文本并将其作为 JSON 提供给您，您无法提取特定文本。使用与上述相同的方法，仅提取成分即可达到所需的结果。

我建议阅读这篇文章 Extract printed text (OCR) using the Computer Vision REST API and Node.js GitHub 文档以获取更多信息。

关于javascript - Azure 计算机视觉 : Recognize Printed Text，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/70045911/

文章推荐： c# - 从 Azure Functions NET5 迁移到 NET6 - 现在如何注册中间件

printing - 为什么 print(print()) 在 Lua 中不像 print(type(2)) 那样工作？
我已经和 Lua 搞了几天，我想出了一些让我三思而后行的事情。 Lua 5.3 的引用手册我还没有看，因为它似乎很复杂，我会尽快查看。好的，在 lua 5.3 中，我们知道 print() 返回 n
haskell - 为什么 `print <$> (print "你好“)` print "你好”？
计算时IO (IO ()) , 两个 (IO ())和 ()是计算出来的，所以为什么 main :: IO (IO ()) main = print (print "Hello, World!")
来自 print(print(print ('aaa' ))) 的 Python 输出
我不太理解从以下位置收到的输出: print(print(print('aaa'))) aaa None None 先aaa清楚了。但我认为第二个 print(aaa) 会抛出一个错误，因为变量 aa
perl - 为什么 "print/regex/? print a : print b"将 "1"放在每行之前？
当我运行下面的 Perl one-liner 时，它会打印 1在每一行的前面，我不想要它。它应该做的只是注释匹配 root 的行. $ cat /etc/passwd | perl -ne 'prin
Swift.print() 与 print()
我发现由于 Xcode 将不再消化 println() 我是留下 Swift.print() 或 print() 。我的问题是，两者有什么区别？我没能在网上或在 swift 前卫郎。 (Swif
printing - 谷歌浏览器扩展 : Print the page silently
我正在开发一个内部 Google Chrome 扩展，它需要一种方法来启动将当前页面打印到打印机。我不希望出现默认的打印对话框(因此，javascript:window.print() 是不可能的)。
printing - Perl6 Terminal::Print 如何提示用户输入文本？
我正在将 Perl6 Terminal::Print 模块用于基于控制台的应用程序。它运行良好 - 但是，现在我需要提示用户输入一串文本。有什么好的方法可以做到这一点？最佳答案这是使用 Ter
lua - 为什么Lua中是 `local print = print`？
在学习第三方的Lua代码时，我发现在主脚本文件的顶部 local insert = table.insert local match = string.match local gsub = strin
lua - 为什么Lua中是 `local print = print`？
在学习第三方的Lua代码时，我发现在主脚本文件的顶部 local insert = table.insert local match = string.match local gsub = strin
Python -> 告诉一个带有 print 语句的程序到 "not print"
我目前正在学习 Python，并开始了一个项目，为 2000-2005 年 MLB 摊牌纸牌游戏创建棒球模拟游戏。这些程序包含棒球比赛的事件，作为单独代码段中间的打印语句(“Jeff 击中单打”，“B
pretty-print - 使用尽可能少的括号的 pretty-print 表达式？
我的问题:在没有多余括号的情况下漂亮地打印表达式的最干净的方法是什么？我有以下 lambda 表达式的表示: Term ::= Fun(String x, Term t) | App(
printing - 为 Julia 中的新类型定义类似 print() 的函数
为了在 Julia 中创建可打印的新类型，应该定义哪些方法？我认为应该只定义 show，然后它将引发其他函数的行为，例如: 打印字符串 repl_show 显示紧凑展示需要为新类型定义以下哪些方
printing - Javascript - 如何判断 window.print() 是否成功？
我有一个页面，用户可以在其中打印一些带有图像和数据的 pdf。我希望他们能够打印他们想要的文件数量，并且能够暂停它们——这意味着他们可以停止打印并防止打印尚未发送到打印机的文件；当然，已经发送到打印机
printing - 为什么 print-circle 默认为 nil？
CLHS 说 An attempt to print a circular structure with *print-circle* set to nil may lead to looping
python - pycharm 自动完成 "print()"而不是 "print"
正如标题所示，在 Pycharm 中使用自动完成功能时，显示的唯一自动完成选项是:print(args,kwargs) 内置我希望自动完成功能以“print”完成，因为这是我通常使用的。我正在使用
go - 如何 fmt.Print ("print this on the center")
是否有可能使用 fmt.Println("...") 打印一个 shell 居中对齐的字符串？最佳答案作为对这个长期回答问题的更新，可以通过使用 fmt 包中的 * 符号来改进@miltonb 发
printing - 如何格式化 PRINT 或 WRITE 语句以覆盖控制台屏幕上的当前行？
我想在控制台屏幕上显示使用 DO 循环完成的计算进度。我可以像这样将进度变量打印到终端: PROGRAM TextOverWrite_WithLoop IMPLICIT NONE INTEGER ::
r - 直接调用对象时获取传递给 `print`的对象名称(不表达 `print`函数)
我正在尝试为我的新对象定义打印方法，并使用传递给 print 的对象名称。使用 deparse(substitute(y)) .这可以完美地使用 print功能明确: obj function (x
printing - Drupal 7 : Print pdf using dompdf
我需要安装 dompdf 方面的帮助。我应该将解压的 zip 文件放在目录中的哪个位置？我按照 INSTALL.txt 进行操作，它显示“将下载的包的内容提取到支持的路径之一”。这是否意味着放入“Mo
c++ - QtWebkit : Printing issue: no images on printed page
我的应用程序中有一个 webkit 小部件，您可以打印它。打印效果很好，除了打印时没有图像，即使屏幕上有图像。打印代码如下: void MainWindow::printPage() { Q

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

javascript - Azure 计算机视觉 : Recognize Printed Text