gpt4 book ai didi

python - 从 OCR 文本中提取分段符?

转载 作者:太空狗 更新时间:2023-10-29 20:28:45 29 4
gpt4 key购买 nike

我正在尝试从 OCR 图像文本的输出中重新创建段落和缩进,如下所示:

输入(想象这是一张图片,不是打字的):

enter image description here

输出(有一些错误):

enter image description here

如您所见,没有保留段落分隔符或缩进。

使用 Python,我尝试了这样的方法,但它不起作用(经常失败):

代码:

def smart_format(text):
textList = text.split('\n')
temp = ''

averageLL = sum([len(line) for line in textList]) / len(textList)

for line in textList:
if (line.strip().endswith('!') or line.strip().endswith('.') or line.strip().endswith('?')) and not line.strip().endswith('-'):
if averageLL - len(line) > 7:
temp += '{{ paragraph }}' + line + '\n'
else:
temp += line + '\n'
else:
temp += line + '\n'

return temp.replace(' -\n', '').replace('-\n', '').replace(' \n', '').replace('\n', ' ').replace('{{ paragraph }}', '\n\n ')

有人对我如何重新创建此布局有任何建议吗?我正在处理旧书,所以我希望用 LaTeX 重新排版它们,因为创建一个 Python 脚本来做到这一点非常简单。

谢谢!

最佳答案

您可以通过查看 entropy 将图像分成多个段落每个 5-10 像素水平切片。虽然这通常用于从较大的图像或视频创建“有趣”的缩略图,但您也可以使用它来识别文本的存在与否。方法如下。

您将图像分成一堆水平 strip ,每个 strip 高 5-10 像素。如果 strip 不是“忙”,那么您可以假设那里没有文本。您可以使用它来隔离段落。现在,您单独提取每个段落,并将其输入到您的 OCR 中。

关于python - 从 OCR 文本中提取分段符?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5925561/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com