xml - 自动填写 I-9 PDF XFA 表格-6ren

xml - 自动填写 I-9 PDF XFA 表格

转载作者：数据小太阳更新时间：2023-10-29 02:28:53

31

4

早上好。我希望有人可以帮助我解决这个问题。去年，我使用 iTextSharp 设置了一个 VB.NET 程序，用户可以在其中输入信息以填写 I9，该信息将填写 PDF 并打印。对于新的 I9，我遇到了未知的困难。

首先，代码不会出错。我只是得到了一个糟糕的结果，因为我得到的不是填写的表格，而是一个 PDF，上面写着“您要加载的文档需要 Adobe Reader 8 或更高版本。您可能没有安装 Adobe Reader ...”等等。所以，我确保我拥有最新的 Reader 版本，再次尝试并得到相同的结果。

考虑到字段名称结构可能发生了变化，我尝试像第一次那样读取格式/字段。 (下面的代码)。但是，现在它告诉我没有要读取的字段 (AcroFields.Fields.Count = 0)。

Private Sub ListFieldNames(pdfTemplate As String)
    Dim pdfTemplate As String = "c:\Temp\PDF\fw4.pdf"
    Dim pdfReader As PdfReader = New PdfReader(pdfTemplate)
    Dim de As KeyValuePair(Of String, iTextSharp.text.pdf.AcroFields.Item)

    For Each de In pdfReader.AcroFields.Fields
        Console.WriteLine(de.Key.ToString())
    Next
End Sub

因此，我开始进行一些搜索，并找到了他们可以切换到的另一种 PDF 结构的引用； XFA。老实说，我还没有找到任何令人满意的文档/样本，但我确实找到了一些代码，看起来应该可以读取 XFA PDF 的结构。 (下面的代码)。我在这里尝试了两种不同的方法。第一个本质上表明 xfaFields 中没有 xmlNode。第二个确实找到了一个名为“数据”的节点(这是它找到的唯一一个)但没有找到任何子节点。

Private Sub ReadXfa(pdfTemplate As String)
    pdfReader.unethicalreading = True
    Dim readerPDF As New PdfReader(pdfTemplate)

    Dim xfaFields = readerPDF.AcroFields.Xfa.DatasetsSom.Name2Node

    For Each xmlNode In xfaFields
        Console.WriteLine(xmlNode.Value.Name + ":" + xmlNode.Value.InnerText)
    Next
    'Example of how to get a field value
    '   Dim lastName = xfaFields.First(Function(a) a.Value.Name = "textFieldLastNameGlobal").Value.InnerText


    Dim reader As New PdfReader(pdfTemplate)
    Dim xfa As New XfaForm(reader)
    Dim node As XmlNode = xfa.DatasetsNode()
    Dim list As XmlNodeList = node.ChildNodes()
    For i As Integer = 0 To list.Count - 1
        Console.WriteLine(list.Item(i).LocalName())
        If "data".Equals(list.Item(i).LocalName()) Then
            node = list.Item(i)
            Exit For
        End If
    Next
    list = node.ChildNodes()
    For i As Integer = 0 To list.Count - 1
        Console.WriteLine(list.Item(i).LocalName())
    Next
    reader.Close()
End Sub

https://www.uscis.gov/system/files_force/files/form/i-9.pdf?download=1

上面的链接转到政府提供的 i9 PDF。

所以...我想我有多个问题。最简单的是是否有人完成了这个过程/他们是否可以帮助我。除此之外，如果有人能为我指出正确的方向，说明如何从这个新的 PDF 文件中读取/写入，那将是惊人的。坦率地说，我什至不确定如何确定他们使用的是什么“类型”的表单 - AcroField、XFA 还是其他？

非常感谢您的时间/帮助!

最佳答案

首先，抱歉我不再做vb.net了，但是你应该可以转换后面的代码。

您自己已经发现新表单是 XFA。有一种简单的非编程方式可以查看表单字段和数据。您注意到您升级了 Adobe Reader 的版本，所以我猜您正在使用 Reader DC。从菜单选项:

Edit => Form Options => Export Data...

将表单导出到您可以检查的 XML 文件。 XML 文件提示您需要相应的 XML 文档来填写表单，这与使用 AcroForm 完成的方式完全不同。

这里有一些简单的代码可以帮助您入门。首先是读取空白 XML 文档并更新它的方法:

public string FillXml(Dictionary<string, string> fields)
{
    // XML_INFILE => physical path to XML file exported from I-9
    XDocument xDoc = XDocument.Load(XML_INFILE);
    foreach (var kvp in fields)
    {
        // handle multiple elements in I-9 form
        var elements = xDoc.XPathSelectElements(
            string.Format("//{0}", kvp.Key)
        );
        if (elements.Count() > 0)
        {
            foreach (var e in elements) { e.Value = kvp.Value; }
        }
    }

    return xDoc.ToString();
}

现在我们有了创建有效 XML 的方法，用一些示例数据填充表单字段:

var fields = new Dictionary<string, string>()
{
    { "textFieldLastNameGlobal", "Doe" },
    { "textFieldFirstNameGlobal", "Jane" }
};
var filledXml = FillXml(fields);

using (var ms = new MemoryStream())
{
    // PDF_READER => I-9 PdfReader instance
    using (PDF_READER)
    {
        // I-9 has password security
        PdfReader.unethicalreading = true;
        // maintain usage rights on output file
        using (var stamper = new PdfStamper(PDF_READER, ms, '\0', true))
        {
            XmlDocument doc = new XmlDocument();
            doc.LoadXml(filledXml);
            stamper.AcroFields.Xfa.FillXfaForm(doc.DocumentElement);
        }
    }
    File.WriteAllBytes(OUTFILE, ms.ToArray());
}

要回答您的最后一个问题，即如何确定表单“类型”，请像这样使用 PdfReader 实例:

PDF_READER.AcroFields.Xfa.XfaPresent

true 表示 XFA，false 表示 AcroForm。

关于xml - 自动填写 I-9 PDF XFA 表格，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/41510154/

31

4

0

文章推荐： ruby - Nokogiri 和 concat()

文章推荐： go - 如何在golang的接口(interface)中添加新方法

文章推荐： regex - 在 Golang 中使用正则表达式从 URL 中提取子域

文章推荐： java - 如何使用 SAX Java 解析器读取评论文本

java - 填写 MBeanParameterInfo
在 JConsole 的 MBeans 选项卡中查看我的应用程序的 MBean 时，有“属性”和“操作”的子菜单。如果将这些树结构展开到最大程度，然后单击其中一个操作，则右侧面板会显示三个部分:操作调
if-statement - 填写 ={ARRAYFORMULA()} 中的空白单元格
我有一个包含稀疏数据的人性化工作表: PART | FRUIT --------------- Alpha | | Apples | Pears Beta |
python - 填写 Pandas 数据框中缺少的小时数
我有一个包含每小时数据的数据框: area date hour output H1 2018-07-01 07:00:00 150 H1
javascript - 填写 html 表格
假设我有这样的 html 表: 16 3 2 13 5 10
r - 填写 R 数据框中缺失的行
我已经将一些原始数据导入到 R 中，如下所示: 表 1: ID Year Value 01 1999 25 01 2000 12 01 2002
r - 填写 R 数据框中缺失的行
我已经将一些原始数据导入到 R 中，如下所示: 表 1: ID Year Value 01 1999 25 01 2000 12 01 2002
python - 填写 PySpark 中前一天缺失的日期
我在以下问题中遇到了同样的问题: Forward Fill New Row to Account for Missing Dates 不同之处在于，我需要计算两个不同日期之间的小时数差异，例如 201
python - 填写 pandas 数据框中的缺失值
我想填写 pandas 数据框中缺失的值。最佳情况下，我希望分钟列的范围为每小时 0-60。不幸的是，数据生成过程没有记录任何 sub_count = 0 的行。有办法做到这一点吗？我的数据涵盖日期
javascript - 填写 addFullName 函数的代码
基本对象问题我似乎无法全神贯注。我确定我想多了。填写 addFullName 函数的代码。该函数应该: Take one input parameter, a person object. Add a
Android - 填写 html 表单并调用提交
是否可以在没有用户交互的情况下调用 html 表单提交？我知道可以通过 HttpClient 发出发布请求，但这并不能解决我的问题。我需要以编程方式在网页上填写一些表单输入字段，然后“单击”提交按钮
python - 填写 Pandas 数据框中的缺失值
Python 的新手，似乎无法找到我正在寻找的确切答案我相信有更简单的方法来填写此信息我有 df1 和 df2 df1: FirstName LastName PhNo uniqueid df
javascript - 填写 PDF 表格
您好，我有一个需要填写的 PDF 表单。该应用程序向用户(表单)提出问题，提交时应将答案填写到 PDF 空白处以供打印。我熟悉 JS 和 Node(有一段时间没用过)。不使用 PHP。我会在我常去
python - 填写 groupby 的缺失日期
假设我有一个如下所示的数据框: ID DATE VALUE 1 31-01-2006 5 1 28-02-2006 5 1 31
javascript - 填写 4 个字符时自动切换到下一个输入字段
我想做的是，在填写四个字符时指向下一个选项卡。每个字段应有 4 个字符，完成后应移至下一个输入框。 $(".inputs").keyup(function () { if (this
javascript - 检查所有输入字段是否已使用 jQuery 填写
我有 3 个 div，每个都有几个输入字段和下一步按钮。我想编写一个 jQuery 片段，当单击下一个按钮时，它会检查以确保与按钮位于同一 div 内的所有输入字段都不为空。我已经尝试了以下但没有成
java - 填写 "secret word"字母
我正在做一个刽子手项目。我已经让大部分代码正常工作了。我无法工作的部分是“ secret 单词”有多个相同的字母。例如“hello”有 2 个“l”。这是代码部分的代码，如果猜测正确，它将“---
java - 填写 list
拥有抽象对象的集合:Set foes; 我想要一个这样的方法: List getFoesByType(TypeEnum type); 我已经尝试过: List result = new ArrayLi
javascript - scrapy 填写 POST 表单
我正在尝试使用 scrapy 填写 POST 表单，以尝试预订火车票。我以为 FormRequest 类可以做这件事，但我无法处理 javascript 表单。 Scrapy 爬虫什么都不返回。我
python - 填写 numpy ndarray 的最佳方法？
我使用以下代码生成带有渐变的图像。我逐个元素访问数组。有更好的方法吗？谢谢。 import cv2 import numpy as np x = np.ndarray((256,256,3), dty
python - 填写 pandas df 中缺少的日期
我有一个数据对应于数据库列表和差异行，以及它们的使用日期。 DB Dates USAGE ABC 03-06-2018 IN USE

首页

博学

6Ren·AI

商城

xml - 自动填写 I-9 PDF XFA 表格