gpt4 book ai didi

c++ - 使用 C++ 读取 pdf 页数

转载 作者:行者123 更新时间:2023-11-28 00:45:30 26 4
gpt4 key购买 nike

我正在尝试阅读编号。使用 pdf 的给定 pdf 中的页面(通过查找“/Count xx”),但我似乎做错了什么。我将所有字符读入缓冲区并使用字符串类的查找来查找。但是在我尝试过的许多文件中,它只工作了一次。我做错了什么?

http://pastebin.com/2FAXPZhE

我是否必须使用 getline() 或其他方法逐行读取它?

PS:我不想使用外部库,因为这是我的大学项目,我不能使用外部工具。

提前致谢。~三角洲

最佳答案

你做错的是你的方法完全不适合你想要完成的事情。出于许多不同的原因 - 我在这里只列出了几个:

1) PDF 支持增量更新,原始 PDF 文件中的页数可能与文件末尾的更新 block 中的页数不同。

2) "/Count"可能用于与文件中的页数完全不同的其他事情。

3) PDF 文件中的页面以树结构存储,该树中的“/Count”字段列出了该树部分中的页数。在包含多个页面的 PDF 文件中,您可能有许多不同的对象,这些对象列出了与页面有关的“/Count”值。

简短的回答是,如果不了解 PDF 文件格式(您可以从 Adob​​e 网站下载 PDF 规范),就不可能正确评估 PDF 文件的页数。您要么必须使用一个了解文件格式并为您解析它的库,要么您将需要编写执行此操作的代码。这不是一个小项目(至少可以说)。

关于c++ - 使用 C++ 读取 pdf 页数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16403864/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com