gpt4 book ai didi

python - 用于文本分类的 Tensorflow 模型

转载 作者:行者123 更新时间:2023-11-28 17:06:02 33 4
gpt4 key购买 nike

我正在使用 OCR 和 Tensorflow 构建一个 Android 应用程序。它在超市扫描价格标签,并且必须将扫描的数据放入不同的字段中。我已经完成了 OCR 部分,所以图像 -> 文本识别工作正常,Tensorflow 只需要处理文本输入。

总体而言,我是 Tensorflow 和机器学习的新手。是否可以使用 Tensorflow 完成以下工作?如果可以,您能否分享一些关于如何做到这一点的想法?

平均输入是这样的:

CARLSBERG
EESTI
HELE OLU 5%
1.59 +0.10
500 ml pudel
3.18 /I
4740019113419

目标是按如下方式对这些数据进行排序:

Brand: CARLSBERG
Product name: HELE OLU 5%
Size: 500
Units: ml

确定特定字符串如何分类的参数是:

  • 案例
  • 行号
  • 超市(默认已知)
  • 总行数
  • 字母/数字比例

最佳答案

我认为第一步是亲自动手或生成一些带标签的训练数据。您应该研究特征提取;例如,如果您注意到某个商品的第二行通常是价格,您可以将其表示为参数。或者说如果一个数字后面跟着一个单位,如 ml/l/oz,它很可能是体积。您想要知道的是您对特定行/字符串表示价格的信心有多大。

但是,我认为 TensorFlow 更适合您已经解决的问题的 OCR 部分。你问的是更多的文本解析,这可以用 NLP approach 更好地解决。 .

关于python - 用于文本分类的 Tensorflow 模型,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50949318/

33 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com