gpt4 book ai didi

python-3.x - 如何使用pytesseract获得每一行的信心

转载 作者:行者123 更新时间:2023-12-03 18:32:18 28 4
gpt4 key购买 nike

我已经成功设置 Tesseract 并且可以将图像转换为文本...

text = pytesseract.image_to_string(Image.open(image))

但是,我需要获得每一行的置信度值。我找不到使用 pytesseract 执行此操作的方法。有人知道怎么做吗?

我知道使用 PyTessBaseAPI 可以做到这一点,但我不能使用它,我花了几个小时试图设置它但没有运气,所以我需要一种使用 pytesseract 来做到这一点的方法。

最佳答案

找了很久,终于找到了办法。而不是 image_to_string , 应该使用 image_to_data .但是,这将为您提供每个单词的统计信息,而不是每一行...

text = pytesseract.image_to_data(Image.open(file_image), output_type='data.frame')

所以我所做的就是将其保存为数据帧,然后使用 pandasblock_num 分组,由于每行都使用 OCR 分组为块,因此我还删除了所有没有置信度值 (-1) 的行...
text = text[text.conf != -1]
lines = text.groupby('block_num')['text'].apply(list)

使用相同的逻辑,您还可以通过计算同一块内所有单词的平均置信度来计算每行的置信度......
conf = text.groupby(['block_num'])['conf'].mean()

关于python-3.x - 如何使用pytesseract获得每一行的信心,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55406993/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com