gpt4 book ai didi

python - 使用 PDFminer 解析 pdf(梵文脚本)会给出错误的输出

转载 作者:太空狗 更新时间:2023-10-30 00:13:58 26 4
gpt4 key购买 nike

<分区>

我正在尝试解析包含印度选民名单的 pdf 文件,该名单采用印地文(梵文脚本)。

PDF 正确显示所有文本,但是当我尝试使用 PDFminer 将此 pdf 转储为文本格式时,它输出的字符与原始 pdf 字符不同

例如显示/正确的词是सामान्य

但是输出的词是सपमपनद

现在我想知道为什么会发生这种情况以及如何正确解析这种类型的 pdf 文件

我还包括示例 pdf 文件-

http://164.100.180.82/Rollpdf/AC276/S24A276P001.pdf

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com