gpt4 book ai didi

python - OCR 阿拉伯语的 Tensorflow 模型

转载 作者:行者123 更新时间:2023-11-28 22:21:23 24 4
gpt4 key购买 nike

我是 Tensorflow 的初学者,我想使用 Tensorflow 构建一个 OCR 模型,该模型可以从阿拉伯草书字体(即联合阿拉伯语手写体)中检测阿拉伯语单词。理想情况下,该模型能够检测阿拉伯语和英语。请查看我目前正在尝试进行 OCR 的词典中页面的附加图像。本书其他页面的字体和布局与英文和阿拉伯文相同。

我有两个问题:

(1) 我会使用连体/草书阿拉伯语文本中的单个字符进行训练,还是需要整个单词或单个字符的边界框?

(2) 是否有任何其他可用的 OCR Tensorflow(或 Keras)模型来处理草书书写,尤其是阿拉伯语。

A scanned page of an Arabic dictionary that I wish to apply OCR with

最佳答案

Tesseract 是 Google 的 OCR 引擎,具有经过阿拉伯语训练的模型。

在此处了解更多信息:https://github.com/tesseract-ocr/tesseract

它支持的语言在这里:https://github.com/tesseract-ocr/tesseract/blob/master/doc/tesseract.1.asc#languages

阿拉伯语数据集在这里:https://github.com/tesseract-ocr/tessdata/blob/master/ara.traineddata

希望这对您有所帮助!

关于python - OCR 阿拉伯语的 Tensorflow 模型,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48358289/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com