gpt4 book ai didi

java - PDFBox getFontSize 返回 -1

转载 作者:行者123 更新时间:2023-12-02 04:34:47 33 4
gpt4 key购买 nike

我正在使用 PDFbox 从 PDF 中获取字体大小。

我扩展了 PDFTextStripper 并覆盖了 writeString 函数,这使我可以访问 TextPosition 对象。

它有一半时间工作正常。但其他时候它返回字体大小为“-1”。这是为什么?这会影响我算法的其余部分。

我试过函数 getHeightgetHeightDirgetFontSize。所有这些我都得到了相同的结果。

这是 writeString 函数:

@Override
protected void writeString(String string, List<TextPosition> textPositions) throws IOException {
for (TextPosition text : textPositions) {
getChar(text);
writeString(string);
}
}

getChar 函数处理信息。

我该如何解决这个问题?提前致谢。

编辑:我正在使用 PDFBox 2.0.2。我的应用程序要求我将任何给定文件转换为 pdf,然后使用 PDFBox 对其进行处理。这个 -1 问题发生在所有电子表格文件中。我使用 Apache POI 3.15 将文档转换为 PDF。它适用于 doc、docx、ppt、pptx、odt、odp

最佳答案

由于您没有共享示例文档,根据您的问题,这是我的推论。

假设 PDFBox 工作正常,如果 getFontSize 返回 -1,则字体大小尚未在源端设置,即在生成 PDF 时。如果根据您的观察,getFontSize 返回 -1 的字符具有相同的大小,这可以被认为是默认大小

如果这没有帮助,对于实际的解决方案,您可以提供任何示例 pdf,正如其他人在评论中提到的那样。

关于java - PDFBox getFontSize 返回 -1,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44517539/

33 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com