c# - 微软计算机视觉 OCR : Disable grouping text by regions-6ren

c# - 微软计算机视觉 OCR : Disable grouping text by regions

转载作者：太空狗更新时间：2023-10-29 21:53:04

26

4

我一直在使用 Microsoft Computer Vision 阅读收据，试图找到替代 Abby 的 OCR 的方法，因为价格差异很大。

我得到的结果总是按地区分组。这显然使得用它们的数量识别相应的字段变得更加困难。

有没有一种方法可以通过 Microsoft Vision 或其他方式实现与 Abby 相同的对齐输出？

这是一张包含结果和收据的图片

光学识别结果

最佳答案

我知道这不是一个完整的解决方案，但我认为这足以让您入门。

计算机视觉 API 返回 JSON result具有 lines 属性，该属性只是具有 boundingBox 属性的对象数组。

这些 boundingBox 是每个短语的“正方形”的左上角坐标和右下角坐标的 X、Y 坐标。

您基本上需要处理此数组并根据此属性“排序”项目。

在此JSFiddle您会看到我正在按 Y 坐标对线进行排序，然后将它们分组。

剩下要做的是对分组进行“更智能”——如果 Y 坐标为 201 和 202，您可以假设它们在同一行，只需将它们添加到同一行，按 X 坐标升序排序。

代码:

if (jsonResponse.status == 'Succeeded') {

  var result = '';
  // Sort lines by Y coordinate
  jsonResponse.recognitionResult.lines.sort(function(a, b) {
    var topLeftYCoordA = a.boundingBox[1];
    var topLeftYCoordB = b.boundingBox[1];
    if (topLeftYCoordA > topLeftYCoordB) {
      return 1;
    }
    if (topLeftYCoordA < topLeftYCoordB) {
      return -1;
    }
    return 0;
  })

  // group lines by Y coordinate
  var grouped = {};

  jsonResponse.recognitionResult.lines.map(function(line) {
    var topLeftYcoordinate = line.boundingBox[1];
    if (!grouped[topLeftYcoordinate]) {
      grouped[topLeftYcoordinate] = line;
    } else {
      grouped[topLeftYcoordinate] += line;
    }
  });
  Object.keys(grouped).forEach(function(yCoordinate) {
    result += yCoordinate + ' - ' + grouped[yCoordinate].text + '</br>';
  })
  $(".right").html(result);
}

结果:

关于c# - 微软计算机视觉 OCR : Disable grouping text by regions，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/41562347/

26

4

0

文章推荐： c# - Powershell 结果集未在 C# 中获取

文章推荐： c# - HttpClient PostAsync 发布空内容

Git:在不提交的情况下切换工作区(计算机)
有没有办法在不进行提交/ check out 的情况下应用差异补丁或类似补丁？我的情况:我工作时经常在计算机之间切换，我的提交历史记录有一堆“switching machines”消息。我最初的猜
assembly - 引导加载程序代码有时会崩溃(三重故障？)计算机
我的自定义引导加载程序中有代码从地址 0x8E00 处的 512 字节缓冲区复制内存。进入高内存，0x100000和更高。这在某些计算机上运行良好，而在其他计算机上崩溃(我假设是三重故障)。此代码在
networking - 是否可以在没有操作系统集成的情况下将数据从服务器推送到客户端(电话、计算机)
服务器有没有办法将一些数据无线无缝地推送到客户端，可能是 Windows(电话)、iPhone、Mac 或 Android 设备，没有任何操作系统集成？如果是这样，最好的设计模式是什么，最好的技术是
hadoop - Hadoop与 super 计算机
我无法理解hadoop的真正本质。如果我有足够的资源来购买可以处理PB级数据的 super 计算机，那么为什么我需要Hadoop基础架构来管理如此大的数据？最佳答案 hadoop的全部目的是能够在
grails - Grails-计算机/浏览器的语言环境不会影响i18n机制
我有一个奇怪的问题，或者我可能无法理解Grails i18n机制的工作原理。我将以下内容插入到index.gsp文件中: LocaleContextHolder.locale:
c# 在启动时锁定 Windows 计算机
我正在尝试为我的小弟弟编写一个简单的程序。他经常在他的电脑后面，但他应该为学校学习简单的算术 :D 我想制作以下程序: 他启动了他的电脑他需要做一些简单的练习并完成如果他做对了 x 次，他可以继续
mysql - 不同主机(计算机)上MySQL数据库的简单数据库备份
有人能告诉我如何在 diff 主机(计算机)上为 MySQL 数据库做一个简单的数据库备份吗？我正在尝试将我的数据库从一台主机(服务器)移动到一台新主机(服务器) 最佳答案如果您只是需要在服务器之间
javascript - 最适合(计算机)网络图的布局
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于 Stack Overflow 来说是无关紧要的，因
android - USBDevice 无法识别 Linux 计算机
我正在尝试让 Android 应用程序使用 USB 电缆与运行 ubuntu 12.04 lts 的 Linux 计算机进行通信。我正在尝试使用 usbdeviceconnection 类，但是当我通
windows - 计算机 sleep 后无法访问 Docker
我刚刚使用 docker-toolbox 1.8.2 安装了 docker在 Windows 10 上。由于由于this issue我不得不使用这些命令重新创建 docker 镜像 docker-m
virtualization - 如何删除处于 GURU_MEDITATION 错误状态的 virtualbox 计算机？
如何删除处于 GURU_MEDITATION 错误状态的 VirtualBox 计算机？在 VirtualBox 未运行时删除该目录是否足够？编辑:发布后，我删除了“在文件管理器中显示”导航到的整个
azure - Azure 计算机 ACI Web 服务部署在哪里？
当我们在 Azure 机器学习服务中将模型部署为 ACIWebService 时，不需要指定任何 deployment_target。根据AzureML documentation对于 azurem
azure - Azure 计算机 ACI Web 服务部署在哪里？
当我们在 Azure 机器学习服务中将模型部署为 ACIWebService 时，不需要指定任何 deployment_target。根据AzureML documentation对于 azurem
python - Blackjack 风格的 Python(计算机)游戏循环不正确
我遇到的主要问题是当我选择 stay 时会发生什么上hand_one ，然后 hit上hand_two . 而不是让我hit or stay上hand_two再次，它让我回到hit or stay上h
linux - 协助通过 Powershell 脚本或其他脚本更新一组 Linux 计算机
我知道我可以使用 putty 来 ssh 进入每台 Linux 机器并更新 CentOS 服务器...但我希望有人能够为我指明正确的方向，告诉我如何通过 PowerShell 或 Windows 中的
algorithm - Donald Knuth 的 MIX 计算机
在 MIX 计算机中，一个单词由五个字节和一个符号组成。符号在内存中是如何表示的？是另一个字节，所以每个字真的是六个字节吗？谢谢。最佳答案你的问题不是很清楚。体系结构规范未指定实际实现。它仅指定
python - 计算机(Windows XP)不想打开 .py
我是 Python 的初级程序员，我的电脑有一个奇怪的问题。当我的计算机上有一个 .py 文件(包含一个有效的脚本)并双击它打开时，会发生以下情况:程序打开(它是黑屏 View )，但它会在一秒钟内自
mysql - 将 mysqldump 自动化到本地 Windows 计算机
我正在尝试在 Windows 上使用 plink 创建到 Linux 机器的隧道，并让转储文件最终出现在 Windows 机器上。看起来 this answer会工作，是我的问题的基础。但是尝试一下并
windows - 使用脚本将 Jenkins 节点暂时离线并重启 Windows 计算机
我想在 Windows 7 和 10 计算机上执行重启，但我首先需要将 Jenkins 节点暂时离线。在执行重启之前，我需要完成所有正在运行的任务。然后我远程登录到服务器并重新启动计算机。然而，在我重
java - 在 Java 中按名称 Ping 计算机
我正在编写一个简单的程序，从 MySQL 数据库中提取计算机名称，然后将这些名称存储到字符串数组列表中(这部分工作正常)。之后，我编写了一个类和一个方法，将字符串作为参数(这将是计算机名称)并尝试对其

首页

博学

6Ren·AI

商城

c# - 微软计算机视觉 OCR : Disable grouping text by regions