gpt4 book ai didi

python - 谷歌云愿景,将线条组合在一起

转载 作者:行者123 更新时间:2023-12-05 09:09:10 26 4
gpt4 key购买 nike

我正在测试 Google 云视觉。我希望它按顺序逐行阅读整个页面。这是代码。

url = 'https://www.sec.gov/Archives/edgar/data/1633917/000163391720000091/q120paypalearningsreleas013.jpg'

def detect_text_uri(uri):
"""Detects text in the file located in Google Cloud Storage or on the Web.
"""
from google.cloud import vision
client = vision.ImageAnnotatorClient()
image = vision.types.Image()
image.source.image_uri = uri

response = client.text_detection(image=image)
texts = response.text_annotations
print('Texts:')

for text in texts:
print('\n"{}"'.format(text.description))

vertices = (['({},{})'.format(vertex.x, vertex.y)
for vertex in text.bounding_poly.vertices])

print('bounds: {}'.format(','.join(vertices)))

if response.error.message:
raise Exception(
'{}\nFor more info on error messages, check: '
'https://cloud.google.com/apis/design/errors'.format(
response.error.message))

if __name__ == '__main__': detect_text_uri(url)

在到达“每个活跃账户的付款交易”之前,您可以看到它表现良好,然后将其与下一行混为一谈。它不再逐行进行。

我该如何解决这个问题?问题是当我查看文档时,我已经在使用文本检测功能。不确定如何进一步改进结果。

最佳答案

Google 愿景在此级别不可配置。

您有两种选择来阅读文档中的文本

TEXT_DETECTION 运行文本检测/光学字符识别 (OCR)。文本检测针对较大图像中的文本区域进行了优化;如果图像是文档,请改用 DOCUMENT_TEXT_DETECTION。

DOCUMENT_TEXT_DETECTION 运行密集文本文档 OCR。当同时存在 DOCUMENT_TEXT_DETECTION 和 TEXT_DETECTION 时优先。

如果 TEXT_DETECTION 和 DOCUMENT_TEXT_DETECTION 返回相同的不令人满意的答案,您必须修改图像本身。

例如使用 Cloud demo api你可以看到立竿见影的效果

我稍微更改了图像,并针对该特定行获得了更好的结果。

Img(裁剪并具有额外的对比度) result

请记住,这只是一个示例,您需要找到足够的方法来修改图像

编辑:也可能值得探索Document AI

关于python - 谷歌云愿景,将线条组合在一起,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62627299/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com