gpt4 book ai didi

Java:如何将PDF写出到文本文件?

转载 作者:行者123 更新时间:2023-11-29 09:51:16 24 4
gpt4 key购买 nike

当我打开 PDF 文件并将内容写入文本文件时,文本文件中的内容变得一团糟。我认为这是因为编码。据我了解 JVM将默认字符集设置为 Cp1252(因为我在 Windows XP 上运行)。我已经更改了默认字符集,但没有任何结果 (System.setProperty("file.encoding", "ISO-8859-1");)

  • 我尝试使用 IText,但生成的内容缺少一些带有变音符号的字母

有什么想法吗?

最佳答案

iText 无法正确读取所有字母的原因可能是字体使用的编码。您可以像这样声明字体:

BaseFont bf = BaseFont.createFont(BaseFont.HELVETICA, BaseFont.CP1252, BaseFont.EMBEDDED);

其中 BaseFont.CP1252 是使用的编码。请注意,某些字体不支持所有类型的编码。

关于Java:如何将PDF写出到文本文件?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1706723/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com