- Java 双重比较
- java - 比较器与 Apache BeanComparator
- Objective-C 完成 block 导致额外的方法调用?
- database - RESTful URI 是否应该公开数据库主键?
我们允许用户上传 PDF 文档供我们存储。我们警告用户在上传 PDF 之前必须将其拼合,但许多人仍然上传包含表单字段的 PDF 文档。我们希望通过在上传到我们的存储之前验证 PDF 文件来防止这种情况。
我们使用 iText-5.1 将文件读取为 byte[] 并使用 PdfReader 打开它。然后我们使用 AcroFields() 提取字段并测试是否存在。目前 getFields().size() 始终返回 0 [参见下面的代码],即使我知道包含表单字段的测试 PDF 也是如此。
PdfReader reader = new PdfReader(bytes);
AcroFields fields = reader.getAcroFields()
boolean hasFormFields =
(fields != null && fields.getFields() != null && fields.getFields().size() > 0);
if (hasFormFields) {
// Report Error to User - throw exception, etc.
}
当 PDF 包含表单字段元素时,我希望 getFields().size() 大于 0。有没有其他方法可以使用 Java 和 iText 识别表单字段?
最佳答案
您使用了正确的方法来识别(有效的)PDF 文件是否包含表单域。您描述的问题是如何处理不符合标准的 PDF 文件,这些文件也包含表单字段但确实存在一些问题,例如缺少 AcroField 字典、缺少 Fields 数组或其他。您有三种可能性:
Fields
数组的文档。 以下代码检查您的方法返回 true 但仍包含表单字段的文档。这些字段也将显示在 *dobe reader 中。
public boolean containsFormFields2() {
AcroFields acroFields = reader.getAcroFields();
if (acroFields.getFields() == null || acroFields.getFields().size() == 0) {
// recheck "manually"
for (int i = 1; i <= super.reader.getNumberOfPages(); i++) {
PdfDictionary page = super.reader.getPageN(i);
PdfArray annots = page.getAsArray(PdfName.ANNOTS);
if (annots != null) {
// check for form fields in general
for (int j = 0; j < annots.size(); j++) {
PdfDictionary po2 = (PdfDictionary) annots.getDirectObject(j);
// FT key only exists for form fields
PdfName type = (PdfName) po2.get(PdfName.FT);
if (type != null) {
return true;
}
}
}
}
return false;
}
else{
return true;
}
}
关于java - 如何识别 PDF 文件是否包含表单域,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57103237/
这是我的本地域名 http://10.10.1.101/uxsurvey/profile/dashboard 在 Controller 中,我为用户列表设置了一个操作 redirect(control
要处理 Canonical URL,最佳做法是执行 301 重定向还是更好地为 www 和非 www 域使用相同的 IP 地址? 例如: 想要的规范 URL/域是 http://example.com
1 内网基础 内网/局域网(Local Area Network,LAN),是指在某一区域内有多台计算机互联而成的计算机组,组网范围通常在数千米以内。在局域网中,可以实现文件管理、应用软件共享、打印机
1 内网基础 内网/局域网(Local Area Network,LAN),是指在某一区域内有多台计算机互联而成的计算机组,组网范围通常在数千米以内。在局域网中,可以实现文件管理、应用软件共享、打印机
我想创建一个 weblogic 集群,其中有两个托管服务器,每个服务器在物理上独立的远程计算机上运行 根据weblogic文档 All Managed Servers in a cluster mus
我正在运行 grails 3.1.4,但在创建允许我将多个域对象绑定(bind)到其他几个域对象的模式时遇到了问题。作为我正在尝试做的一个例子: 我有三个类(class)。书籍、作者和阅读列表。 作者
我试图使用@count函数来根据它获取数据,但是在没有崩溃报告的情况下它以某种方式崩溃了。 这是代码 class PSMedia: Object { @objc dynamic var id
有谁知道是否有办法只输入字母字符而不输入数字?我想过这样的事情 CREATE DOMAIN countryDomain AS VARCHAR(100) CHECK( VALUE ??? );
我的代码: const checkoutUrl = 'https://example.com/checkout/*' window.onload = startup() function st
一些不是我编写的应用程序,也不是用 PHP 编写的,它为域 www.example.com 创建了一个 cookie。 我正在尝试替换该 cookie。所以在 PHP 中我做到了: setcookie
什么是 oauth 域?是否有任何免费的 oauth 服务?我可以将它用于 StackApps registration 吗? ?我在谷歌上搜索了很多,但找不到答案。 最佳答案 这是redirect_
自从 In October 2009, the Internet Corporation for Assigned Names and Numbers (ICANN) approved the cre
我使用 apache 作为我的应用程序 Web 服务器的代理,并希望即时更改与 sessionid cookie 关联的域名。 该cookie有一个与之关联的.company.com域,我想使用apa
我只想托管一个子域到cloudflare。我不想将主域名的域名服务器更改为他们的域名服务器。真的有可能吗? 最佳答案 是的,这是可能的,但是需要通过CloudFlare合作伙伴进行设置,或者您需要采用
When using socket in the UNIX domain, it is advisable to use path name for the directory directory m
想象两个共享一个域类的 Grails 应用程序。也许是 Book 域类。 一个应用程序被标识为数据的所有者,一个应用程序必须访问域数据。类似于亚马逊和亚马逊网络服务。 我想拥有的应用程序将使用普通的域
我有一个包含字段“URL”的表单。第一部分需要用户在文本框中填写。第二部分是预定义的,显示在文本框的右侧。 例如,用户在文本框中输入“test”。第二部分预定义为“.example.com”。因此,总
如果我要关闭并取消分配 azure 中的域 Controller ,从而生成新的 vm Generationid,我需要采取哪些步骤来恢复它? 最佳答案 what steps do I need to
我想尝试使用 Azure 作为托管提供商(我有一个域)。我读过那篇文章https://learn.microsoft.com/en-us/azure/app-service-web/web-sites
所以.... 我想知道是否有人可以在这方面协助我? 基本上,我已经创建了一个自托管的Docker容器,用作构建代理(Azure DevOps) 现在,我已经开始测试代理,并且由于我们的放置文件夹位于W
我是一名优秀的程序员,十分优秀!