gpt4 book ai didi

java - 根据坐标或tessaract提取图像数据并将内容写入docs/docx word文件

转载 作者:行者123 更新时间:2023-11-30 10:00:16 24 4
gpt4 key购买 nike

我有图像。想要使用 python 将具有相同布局的图像数据提取到 docx 文件中并以可读的形式。我已经尝试过在图像上应用 tessaract 并使用 pyteesaract 转换为 pdf然后将pdf转换为word文件但我无法维护布局和格式。

最佳答案

这个问题之前已经回答过in here 。您可以使用 pdf2image 库来解决此问题:

from pdf2image import convert_from_path

pages = convert_from_path('sample.pdf', 400) //400 is the Image quality in DPI (default 200)

pages[0].save("sample.png")

关于java - 根据坐标或tessaract提取图像数据并将内容写入docs/docx word文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59309580/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com