gpt4 book ai didi

python - 如何将 Tika python 与 Tesseract OCR 绑定(bind)?

转载 作者:行者123 更新时间:2023-12-04 16:10:13 36 4
gpt4 key购买 nike

当我在终端中调用它时,它工作得很好!

tesseract 1.jpg outPutFileHere -l fra

但我正在尝试让它与 tika 一起使用

import tika
import sys
from tika import parser
from tika import detector
tikedDocument = parser.from_file(TextImage)

对于相同的文本图像,我在 tika 上没有结果:(

你知道发生了什么事吗?

谢谢

最佳答案

例如,您需要提供名为“X-Tika-OCRLanguage”的 header :

headers = {
"X-Tika-OCRLanguage": "eng+nor"
}
parsed = parser.from_file(path, headers=headers)

关于python - 如何将 Tika python 与 Tesseract OCR 绑定(bind)?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43652543/

36 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com