gpt4 book ai didi

pdf - 查找用于文本提取的测试 PDF?

转载 作者:行者123 更新时间:2023-11-28 20:41:50 24 4
gpt4 key购买 nike

这不完全是一个编程问题,所以我不确定在这里发帖是否合适?

无论如何,我已经编写了一个 PDF 文本提取器,并且正在寻找棘手的 PDF 来测试它。我在网上进行了大量搜索,找到的所有 PDF 都可以使用。

但是,我知道还有一些我还没有测试。

例如,我似乎找不到带有缺少“ToUnicode”条目的 CID 字体的 PDF。

此外,我似乎找不到任何带有棘手或令人困惑的 PostScript 的 PDF。

谁能推荐一下?

最佳答案

您可以开始使用这些(简单但棘手的)手写 PDF 进行测试:

要使用删除了一些 /ToUnicode 表的真实 PDF 文件进行测试,请参见此处:

关于pdf - 查找用于文本提取的测试 PDF?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29498494/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com