gpt4 book ai didi

python - 在 Pytesser 中使用多种语言

转载 作者:行者123 更新时间:2023-11-28 20:40:00 24 4
gpt4 key购买 nike

我已经开始使用 Pytesser,它对英文和中文都很好,但是有没有办法让两种语言同时工作?我必须制作自己的训练数据文件吗?我的代码是:

import Image
from pytesser import *
print image_to_string(Image.open("chinese_and_english.jpg"), lang="eng")
#also want to have chinese be recognized

chinese_and_english

最佳答案

我不确定 Pytesser 但使用 tesserocr您可以指定多种语言。例如:

import tesserocr

with tesserocr.PyTessBaseAPI(lang='eng+chi_tra') as api:
api.SetImageFile('eSXSz.jpg')
print api.GetUTF8Text()

# or simply
print tesserocr.file_to_text('eSXSz.jpg', lang='eng+chi_tra')

图片输出示例:

In [8]: print tesserocr.file_to_text('eSXSz.jpg', lang='eng+chi_tra')
Character, Chmese 動m川爬d
胸肌岫馴伽 H枷﹏ P﹏… …

〔Manda‥﹝ 二 Standard C…爬虯







X慣ng怕ng

请注意,如第一个示例中那样初始化一次 API 并通过调用 SetImageFile 将其重新用于多个图像会更有效。 (或使用 SetImage 对象的 PIL.Image)以避免每次都重新初始化 API。

关于python - 在 Pytesser 中使用多种语言,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36746902/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com