gpt4 book ai didi

python - 如何使用 Wand 更改图片的对比度?

转载 作者:行者123 更新时间:2023-12-01 00:11:01 25 4
gpt4 key购买 nike

我在 Tesseract OCR 中使用了下面的图片:

enter image description here

我处理图片的代码是:

# HOCR
with image[450:6200, 840:3550] as cropped:
imgPage = wi(image = cropped)
imageBlob = imgPage.make_blob('png')
horas = gerarHocr(imageBlob)

def gerarHocr(imageBlob):
image = Image.open(io.BytesIO(imageBlob))
markup = pytesseract.image_to_pdf_or_hocr(image, lang='por', extension='hocr', config='--psm 6')
soup = BeautifulSoup(markup, features='html.parser')

spans = soup.find_all('span', {'class' : 'ocrx_word'})

listHoras = []
...
return listHoras

尽管我的 OCR 有时会感到困惑,并将 83 重复,并返回 07:44/14:183 而不是 例如 07:44/14:13

我认为如果我使用 Wand 删除灰线,我会提高 OCR 的置信度。请问我该怎么做?

谢谢,

最佳答案

如果系统使用ImageMagick-6,您可以调用Image.threshold() ,但可能需要先删除透明度。

with Image(filename='PWILE.png') as img:
img.background_color = 'WHITE'
img.alpha_channel = False
img.threshold(threshold=0.5)
img.save(filename='output_threshold.png')

Image.threshold

如果您使用的是 ImageMagick-7(任何高于版本 7.0.8-41),则 Image.auto_threshold()会起作用的。

with Image(filename='support/PWILE.png') as img:
img.auto_threshold(method='otsu')

关于python - 如何使用 Wand 更改图片的对比度?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59632931/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com