gpt4 book ai didi

image-processing - Tesseract:如何一次用多种语言运行tesseract

转载 作者:行者123 更新时间:2023-12-04 00:07:31 27 4
gpt4 key购买 nike

我必须分析包含英语和日语文本的图像。默认情况下,我运行tesseract(eng)时,一些日语字符丢失了。否则,如果我使用日语(-l jpn)运行tesseract,则会丢失一些英文字符(例如,电子邮件)。
如何运行一个可以识别英文和日文字符的进程。
谢谢。

最佳答案

从tesseract 3.02开始,可以为-l参数指定多种语言。


-l lang使用的语言。如果未指定,则假定为英语。可以指定多种语言,用加号分隔。
Tesseract使用3个字符的ISO 639-2语言代码。


一个例子:

tesseract myscan.png out -l deu+eng

关于image-processing - Tesseract:如何一次用多种语言运行tesseract,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24379781/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com