gpt4 book ai didi

pdf - 修复 PDF 编码

转载 作者:行者123 更新时间:2023-12-01 16:15:25 25 4
gpt4 key购买 nike

我有阿拉伯语 PDF 文件,其编码似乎有问题。

当我尝试在 PDF 中搜索其中的单词时,没有找到结果

当我尝试使用其他程序将 pdf 内容导出到 Excel 时,它会以奇怪的编码导出数据

当我将 PDF 中的数据复制到记事本时,记事本显示奇怪的编码。

我正在开发将使用这些 PDF(大约 950 个文件)的解决方案,因此我必须找到一种修复编码的方法。

提前致谢

最佳答案

免责声明:我从未编辑过阿拉伯语文件。

如何将 .pdf 内容导出到 Excel?

无法使用 Word/Excel/Wordpad 或记事本直接打开 .pdf 文件,您看到的奇怪编码很可能是所选字体资源的特定编码。

你可以用这个 this检测编码的工具

但我真的建议你阅读最少的内容 Unicode and Character Sets

从那时起,考虑到涉及的文件量,一个好的解决方案似乎是 PyODConverter

对于较小数量的文件, Free PDF to Word Converter将满足您的需求:

关于pdf - 修复 PDF 编码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8214646/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com