作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
使用此工具 http://trainyourtesseract.com/我希望能够在 pytesseract 中使用新字体。该工具给了我一个名为 *.traineddata 的文件
现在我正在使用这个简单的脚本:
try:
import Image
except ImportError:
from PIL import Image
import pytesseract as tes
results = tes.image_to_string(Image.open('./test.jpg'),boxes=True)
file = open('parsing.text','a')
file.write(results)
print(results)
*.traineddata
可以作为命令行程序与 Tesseract 一起使用。所以我的问题还是一样,我如何在 python 中使用traineddata?
最佳答案
下面是带有选项的 pytesseract.image_to_string()
示例。
pytesseract.image_to_string(Image.open("./imagesStackoverflow/xyz-small-gray.png"),
lang="eng",boxes=False,
config="--psm 4 --oem 3
-c tessedit_char_whitelist=-01234567890XYZ:"))
"eng"
中的
lang="eng"
替换为您的语言
name(.traineddata)
。
关于ocr - 如何在 pytesseract 中使用经过训练的数据?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44183679/
我是一名优秀的程序员,十分优秀!