gpt4 book ai didi

ocr - 表单识别器(带标签的自定义模型)未获取正确的数据

转载 作者:行者123 更新时间:2023-12-04 03:39:31 25 4
gpt4 key购买 nike

目前,我正在使用 表单识别器 2.1 版预览 从包含扫描图像的 PDF 文件中提取数据。文本被正确获取,但值与标签的映射不符合预期。我正在使用自定义模型 Train with labels从文件中提取数据并使用 FOTT website标记数据,它提供了手动标记数据的功能。我已经用手动标记的数据训练了 5 页的模型,但没有给出正确的响应。也试过Train without labels没有给出正确的结果。但是,该模型没有给出确切的结果。某些标签未获取,某些标签的结果值不完整。我已经阅读了来自 Microsoft Docs 的文档用于了解此认知服务。它没有按预期给出正确的结果,我不明白这有什么问题。所以,我想知道没有得到正确结果的可能原因是什么。

最佳答案

在训练模型时,您是否使用了来自相同结构的 5 个文档?为了改进模型,您还可以添加一些额外的文档,以便您的训练数据代表您尝试从中提取数据的文档。在分析文档时,如果缺少键值对,您可以将该文档添加到训练数据并训练模型,以便它也可以针对该文档进行改进。

关于ocr - 表单识别器(带标签的自定义模型)未获取正确的数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/66312524/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com