gpt4 book ai didi

python - 使用 Python 突出显示 PDF 中的文本

转载 作者:太空狗 更新时间:2023-10-30 00:05:38 24 4
gpt4 key购买 nike

<分区>

我正在为我的 PDF 数据语料库开发自定义搜索引擎。

我有一个转换层,可以将 PDF 内容转储为文本(使用 Apache Tika 和 GROBID)。我已经完成了搜索层和返回搜索结果列表的 View 。

现在,我想在原始 PDF 中为出现搜索词的行添加突出显示功能。是的,如果有必要,我想修改 PDF 文件。

有什么办法可以在 PDF 文件中突出显示文本? PDFMiner 或 PyPDF2 或其他 Python 库是否能够做到这一点?

...或者您可以为它推荐其他服务,也许是外部服务?

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com