- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有 1000 份调查表需要扫描,然后上传到我的 C# 系统以提取数据并将其输入数据库。这些调查混合了手写的 1) 文本框和 2) 复选框。我目前正在使用 Azure Read Api 来提取应该可以正常工作的手写文本,例如下面的问题 #4 返回“Python”和“编码”。
所以我的问题;任何 AWS Textract 都会给我提取标记了复选框的数据的能力吗?例如请参阅下面的问题 #1 - 我需要一个表示“不同意”的字符串,这对任何 AWS Textract API 都可行吗?
很遗憾,Azure Read API 和 Google Vision OCR 不提供此功能,因此如果 AWS Textract 无法帮助我解决此问题,我将不得不手动执行一些操作,例如检查像素颜色的变化以检测勾选的复选框。
调查类型:
最佳答案
是的,Amazon Textract 支持检测各种字段输入,例如复选框和单选按钮。您可以阅读有关详细信息的更多信息 in the docs here和 here .
我编写了一个快速脚本来使用以下代码为您的图像调用 Textract,它正确识别了不同表单字段的键和值,此外还识别了给定字段是否被选中/未选中。
# python 3
import boto3
# instantiate client
textract = boto3.client('textract')
# read image bytes
with open("textract-test.png", "rb") as image:
f = image.read()
image_data = bytearray(f)
print(image_data[0])
# call textract endpoint
textract.analyze_document(Document={'Bytes': image_data}, FeatureTypes=['FORMS'])
结果输出将是一系列“ block ”,它们代表单独的文本 block 或表单输入。解析此 JSON,我们可以找到与选定复选框对应的 block ,类似于以下内容:
"Id": "0abb6f4e-4512-4581-b261-a45f2426973f",
"SelectionStatus": "SELECTED" // value of interest. Alternatively, "NOT_SELECTED"
},
{
"BlockType": "SELECTION_ELEMENT",
"Confidence": 54.00064468383789,
"Geometry": {
"BoundingBox": {
"Width": 0.030619779601693153,
"Height": 0.024501724168658257,
"Left": 0.4210366904735565,
"Top": 0.439885675907135
},
"Polygon": [
{
"X": 0.4210366904735565,
"Y": 0.439885675907135
},
{
"X": 0.4516564607620239,
"Y": 0.439885675907135
},
{
"X": 0.4516564607620239,
"Y": 0.4643873870372772
},
{
"X": 0.4210366904735565,
"Y": 0.4643873870372772
}
]
},
很抱歉没有在 C# 中创建示例,但您可以通过 CLI 使用 Textract或 AWS .NET SDK对于类似的效果。
注意:如果您只想了解 Amazon Textract 将为您的数据返回什么样的响应,您可以导航到 AWS 管理控制台中的 Amazon Textract 页面并使用图像在那里测试应用程序。您可以使用 GUI 可视化某些结果,或下载完整的 API 响应。
关于c# - 带有手写复选框的 AWS textract,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58886391/
目录 1、背景 2、样本均值和样本方差矩阵 3、PCA 3.1 最大投影方差 3.2 最小重构距离 4、Py
android中获取屏幕的长于宽,参考了网上有很多代码,但结果与实际不符,如我的手机是i9000,屏幕大小是480*800px,得到的结果却为320*533 结果很不靠谱,于是自己写了几行代码,亲测
我写了一个 vector 类来学习 move 语义。 我使用 move 构造函数来 move T(注释行)。 我的问题是为什么不像在 C 中一样复制临时对象的所有字节并将临时对象的所有字节设置为零?
我需要解析一种类似于 Java 的最小化版本的语言。由于效率是最重要的因素,所以我选择手写解析器而不是像 GOLD、bison 和 yacc 这样的 LRAR 解析器生成器。 但是我找不到优秀的手写解
我正在尝试向 perlin 单纯形噪声函数添加 asm.js 注释: "use strict"; // Ported from Stefan Gustavson's java implementati
之前在bind和apply以及call函数使用中详解总结过bind和apply以及call函数的使用,下面手写一下三个函数。 一、首先call函数 Function.prototype.MyCall
我正在 asm.js 中编写优先级队列和八叉树Javascript 的子集,以便从它们中挤出最后可能的性能。 但是,您如何在 asm.js 函数的 heap 中存储对 Javascript 对象的引用
我是一名优秀的程序员,十分优秀!