gpt4 book ai didi

detection - Google Cloud Vision API 是否有任何选项可以从扫描的图像中检测并返回表格(带标题的行和列)?

转载 作者:行者123 更新时间:2023-12-05 06:34:44 24 4
gpt4 key购买 nike

我们使用 Google Cloud Vision API 来提取发票字段。我们想知道API是否支持检测数据表?或者我们是否必须编写自定义代码来检测表格?

最佳答案

Google Vision API 不会以结构化方式从表单返回数据。但是,文本周围的多边形 (boundingPoly) 的坐标将在响应中提供。 Take a look at this example :

{
"description": "ABBEY",
"boundingPoly": {
"vertices": [ {
"x": 44,
"y": 43
}, ...
] }, ...
}

您可以使用的一种方法是确定发票字段的坐标,然后编写一些代码来遍历 JSON 响应的 boundingPoly 对象,以检查顶点所在的区域是否与你的领域的区域。如果 boundingPoly 坐标与您的字段位于同一区域,那么 - 例如使用 Python - 您可以使用字典将这些词映射到您的字段名称。

关于detection - Google Cloud Vision API 是否有任何选项可以从扫描的图像中检测并返回表格(带标题的行和列)?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50133223/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com