- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在使用 Azure 计算机视觉和 Nodejs,我想提取图像上的文本,它按预期工作,但我面临一些挑战:代码:
'use strict';
const request = require('request');
const subscriptionKey = 'key';
const endpoint = 'endpoint'
var uriBase = endpoint + 'vision/v3.1/ocr';
const imageUrl = 'https://livesimply.me/wp-content/uploads/2015/09/foods-to-avoid-real-food-3036-2-1024x683.jpg';
// Request parameters.
const params = {
'language': 'unk',
'detectOrientation': 'true',
};
const options = {
uri: uriBase,
qs: params,
body: '{"url": ' + '"' + imageUrl + '"}',
headers: {
'Content-Type': 'application/json',
'Ocp-Apim-Subscription-Key' : subscriptionKey
}
};
request.post(options, (error, response, body) => {
if (error) {
console.log('Error: ', error);
return;
}
let jsonResponse = JSON.stringify(JSON.parse(body), null, ' ');
console.log('JSON Response\n');
console.log(jsonResponse);
});
输出:
"regions": [
{
"boundingBox": "0,191,277,281",
"lines": [
{
"boundingBox": "53,191,23,49",
"words": [
{
"boundingBox": "53,191,23,49",
"text": "in"
}
]
},
{
"boundingBox": "0,285,277,82",
"words": [
{
"boundingBox": "0,285,150,82",
"text": ")arb.0g"
},
{
"boundingBox": "214,288,63,63",
"text": "0%"
}
]
},
{
"boundingBox": "14,393,45,79",
"words": [
{
"boundingBox": "14,393,45,79",
"text": "Og"
}
]
},
{
"boundingBox": "213,394,63,63",
"words": [
{
"boundingBox": "213,394,63,63",
"text": "00/0"
}
]
}
]
},
{
"boundingBox": "322,184,352,457",
"lines": [
{
"boundingBox": "326,184,348,54",
"words": [
{
"boundingBox": "326,184,239,52",
"text": "INGREDIENTS:"
},
{
"boundingBox": "588,188,86,50",
"text": "WHITE"
}
]
},
{
"boundingBox": "325,248,281,59",
"words": [
{
"boundingBox": "325,248,83,56",
"text": "TUNA,"
},
{
"boundingBox": "417,250,127,51",
"text": "SOYBEAN"
},
{
"boundingBox": "555,252,51,55",
"text": "OIL,"
}
]
},
{
"boundingBox": "324,313,341,60",
"words": [
{
"boundingBox": "324,313,155,52",
"text": "VEGETABLE"
},
{
"boundingBox": "489,316,101,56",
"text": "BROTH,"
},
{
"boundingBox": "598,317,67,56",
"text": "SALT,"
}
]
},
{
"boundingBox": "324,378,334,53",
"words": [
{
"boundingBox": "324,378,235,52",
"text": "PYROPHOSPHATE"
},
{
"boundingBox": "566,381,92,50",
"text": "ADDED"
}
]
},
{
"boundingBox": "323,519,248,52",
"words": [
{
"boundingBox": "323,519,193,51",
"text": "DISTRIBUTED"
},
{
"boundingBox": "528,521,43,50",
"text": "BY:"
}
]
},
{
"boundingBox": "322,584,298,57",
"words": [
{
"boundingBox": "322,584,124,50",
"text": "BUMBLE"
},
{
"boundingBox": "457,585,52,50",
"text": "BEE"
},
{
"boundingBox": "519,585,101,56",
"text": "FOODS,"
}
]
}
]
},
{
"boundingBox": "791,400,198,117",
"lines": [
{
"boundingBox": "921,400,68,45",
"words": [
{
"boundingBox": "921,400,68,45",
"text": ",11."
}
]
},
{
"boundingBox": "791,464,128,53",
"words": [
{
"boundingBox": "791,464,75,53",
"text": "PRC:"
},
{
"boundingBox": "874,467,45,48",
"text": "x"
}
]
}
]
}
]
}
但是我在使用这段代码时遇到了一些挑战:
感谢各位专家的帮助。
最佳答案
我们使用计算机视觉 REST API 通过光学字符识别 (OCR) 从图像中提取打印文本。成功的响应会以 JSON 格式返回。您无法从此 Azure 认知服务获取直接字符串输出。
对于问题-
I want the output as a string and not JSON tree.
我们无法像图中所示的字符串一样直接打印成分。要提取内容并以特定格式显示它,在获取 JSON 字符串后,将其解析为 JSON 对象并运行循环以从中提取数据。之后使用 split 函数将数据存储到数组中。如下面的代码片段所示。
function(error, response, body){
if(error) {
console.log(error);
} else {
//parsing the JSON string
var jsonObj = JSON.parse(body);
var ob = jsonObj;
//running loop to extract the text values
for(i=0;i<....){
for(j=0;j<....){
for(k=0;k<....){
var str = str + " "+ob.....text;
}
str = str + "\n";
}
}
var arr = str.split("\n");
根据您获得的 JSON 结构放置您的逻辑。
对于你的第二个问题和第三个问题 -
I would like to extract just the ingredients and not the all text.
In some cases the images may have ingredients without specifying the ingredient key-word, how can I extract the ingredients in this case ?
计算机视觉将从图像中提取所有打印文本并将其作为 JSON 提供给您,您无法提取特定文本。使用与上述相同的方法,仅提取成分即可达到所需的结果。
我建议阅读这篇文章 Extract printed text (OCR) using the Computer Vision REST API and Node.js GitHub 文档以获取更多信息。
关于javascript - Azure 计算机视觉 : Recognize Printed Text,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/70045911/
我已经和 Lua 搞了几天,我想出了一些让我三思而后行的事情。 Lua 5.3 的引用手册我还没有看,因为它似乎很复杂,我会尽快查看。 好的,在 lua 5.3 中,我们知道 print() 返回 n
计算时IO (IO ()) , 两个 (IO ())和 ()是计算出来的,所以为什么 main :: IO (IO ()) main = print (print "Hello, World!")
我不太理解从以下位置收到的输出: print(print(print('aaa'))) aaa None None 先aaa清楚了。但我认为第二个 print(aaa) 会抛出一个错误,因为变量 aa
当我运行下面的 Perl one-liner 时,它会打印 1在每一行的前面,我不想要它。它应该做的只是注释匹配 root 的行. $ cat /etc/passwd | perl -ne 'prin
我发现由于 Xcode 将不再消化 println() 我是 留下 Swift.print() 或 print() 。我的问题是, 两者有什么区别?我没能 在网上或在 swift 前卫郎。 (Swif
我正在开发一个内部 Google Chrome 扩展,它需要一种方法来启动将当前页面打印到打印机。我不希望出现默认的打印对话框(因此,javascript:window.print() 是不可能的)。
我正在将 Perl6 Terminal::Print 模块用于基于控制台的应用程序。 它运行良好 - 但是,现在我需要提示用户输入一串文本。 有什么好的方法可以做到这一点? 最佳答案 这是使用 Ter
在学习第三方的Lua代码时,我发现在主脚本文件的顶部 local insert = table.insert local match = string.match local gsub = strin
在学习第三方的Lua代码时,我发现在主脚本文件的顶部 local insert = table.insert local match = string.match local gsub = strin
我目前正在学习 Python,并开始了一个项目,为 2000-2005 年 MLB 摊牌纸牌游戏创建棒球模拟游戏。这些程序包含棒球比赛的事件,作为单独代码段中间的打印语句(“Jeff 击中单打”,“B
我的问题:在没有多余括号的情况下漂亮地打印表达式的最干净的方法是什么? 我有以下 lambda 表达式的表示: Term ::= Fun(String x, Term t) | App(
为了在 Julia 中创建可打印的新类型,应该定义哪些方法?我认为应该只定义 show,然后它将引发其他函数的行为,例如: 打印 字符串 repl_show 显示紧凑 展示 需要为新类型定义以下哪些方
我有一个页面,用户可以在其中打印一些带有图像和数据的 pdf。我希望他们能够打印他们想要的文件数量,并且能够暂停它们——这意味着他们可以停止打印并防止打印尚未发送到打印机的文件;当然,已经发送到打印机
CLHS 说 An attempt to print a circular structure with *print-circle* set to nil may lead to looping
正如标题所示,在 Pycharm 中使用自动完成功能时,显示的唯一自动完成选项是:print(args,kwargs) 内置 我希望自动完成功能以“print”完成,因为这是我通常使用的。我正在使用
是否有可能使用 fmt.Println("...") 打印一个 shell 居中对齐的字符串? 最佳答案 作为对这个长期回答问题的更新,可以通过使用 fmt 包中的 * 符号来改进@miltonb 发
我想在控制台屏幕上显示使用 DO 循环完成的计算进度。我可以像这样将进度变量打印到终端: PROGRAM TextOverWrite_WithLoop IMPLICIT NONE INTEGER ::
我正在尝试为我的新对象定义打印方法,并使用传递给 print 的对象名称。使用 deparse(substitute(y)) .这可以完美地使用 print功能明确: obj function (x
我需要安装 dompdf 方面的帮助。我应该将解压的 zip 文件放在目录中的哪个位置?我按照 INSTALL.txt 进行操作,它显示“将下载的包的内容提取到支持的路径之一”。这是否意味着放入“Mo
我的应用程序中有一个 webkit 小部件,您可以打印它。打印效果很好,除了打印时没有图像,即使屏幕上有图像。 打印代码如下: void MainWindow::printPage() { Q
我是一名优秀的程序员,十分优秀!