gpt4 book ai didi

ocr - 微调模型的最佳实践?

转载 作者:行者123 更新时间:2023-12-03 08:34:33 24 4
gpt4 key购买 nike

我有一些关于微调过程的问题。我正在构建一个能够识别以下文档中的数据的应用程序:

  • 身份证
  • 驾驶执照
  • 护照
  • 收据

它们都有不同的字体(尤其是收据),很难匹配完全相同的字体,我必须使用许多相似的字体来训练模型。

所以我的问题是:

  1. 我是否应该为每种文档类型训练一个单独的模型以获得更好的性能和准确性,或者在一堆与此类文档使用的字体?

  2. 每种字体应该生成多少页训练数据?默认情况下,我认为 tesstrain.sh 会生成大约 4k 页面。也许有关于如何生成最接近真实输入数据的训练数据的任何建议

  3. 应该使用多少次迭代?

例如,如果我使用某种错误率较高的字体,并且我希望目标准确率为 98% - 99%

也许你们中的一些人有处理此类文档的经验,也许您知道这些文档使用的一些常见字体?

我知道护照和身份证中的机读区使用的是 OCR-B 字体,但是文档的其余部分呢?

提前致谢!

最佳答案

答1您可以训练单个模型来实现相同的目标,但如果您想检测不同的语言,那么我认为您将需要不同的模型。

答2如果您正在寻找一些数据集,请查看此 Mnist Png Dataset其中包含来自各种计算机字体的数字和字母。以下是一些起始代码的链接,用于使用 Pytorch 中实现的数据集。

答3您可以使用optuna找到最适合您的模型的参数集,但您将需要一些

看看这些

他们正在努力完成类似的任务。希望它能回答您的问题...!

关于ocr - 微调模型的最佳实践?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/64332859/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com