gpt4 book ai didi

xml - 自动填写 I-9 PDF XFA 表格

转载 作者:数据小太阳 更新时间:2023-10-29 02:28:53 31 4
gpt4 key购买 nike

早上好。我希望有人可以帮助我解决这个问题。去年,我使用 iTextSharp 设置了一个 VB.NET 程序,用户可以在其中输入信息以填写 I9,该信息将填写 PDF 并打印。对于新的 I9,我遇到了未知的困难。

首先,代码不会出错。我只是得到了一个糟糕的结果,因为我得到的不是填写的表格,而是一个 PDF,上面写着“您要加载的文档需要 Adob​​e Reader 8 或更高版本。您可能没有安装 Adob​​e Reader ...”等等。所以,我确保我拥有最新的 Reader 版本,再次尝试并得到相同的结果。

考虑到字段名称结构可能发生了变化,我尝试像第一次那样读取格式/字段。 (下面的代码)。但是,现在它告诉我没有要读取的字段 (AcroFields.Fields.Count = 0)。

Private Sub ListFieldNames(pdfTemplate As String)
Dim pdfTemplate As String = "c:\Temp\PDF\fw4.pdf"
Dim pdfReader As PdfReader = New PdfReader(pdfTemplate)
Dim de As KeyValuePair(Of String, iTextSharp.text.pdf.AcroFields.Item)

For Each de In pdfReader.AcroFields.Fields
Console.WriteLine(de.Key.ToString())
Next
End Sub

因此,我开始进行一些搜索,并找到了他们可以切换到的另一种 PDF 结构的引用; XFA。老实说,我还没有找到任何令人满意的文档/样本,但我确实找到了一些代码,看起来应该可以读取 XFA PDF 的结构。 (下面的代码)。我在这里尝试了两种不同的方法。第一个本质上表明 xfaFields 中没有 xmlNode。第二个确实找到了一个名为“数据”的节点(这是它找到的唯一一个)但没有找到任何子节点。

Private Sub ReadXfa(pdfTemplate As String)
pdfReader.unethicalreading = True
Dim readerPDF As New PdfReader(pdfTemplate)

Dim xfaFields = readerPDF.AcroFields.Xfa.DatasetsSom.Name2Node

For Each xmlNode In xfaFields
Console.WriteLine(xmlNode.Value.Name + ":" + xmlNode.Value.InnerText)
Next
'Example of how to get a field value
' Dim lastName = xfaFields.First(Function(a) a.Value.Name = "textFieldLastNameGlobal").Value.InnerText


Dim reader As New PdfReader(pdfTemplate)
Dim xfa As New XfaForm(reader)
Dim node As XmlNode = xfa.DatasetsNode()
Dim list As XmlNodeList = node.ChildNodes()
For i As Integer = 0 To list.Count - 1
Console.WriteLine(list.Item(i).LocalName())
If "data".Equals(list.Item(i).LocalName()) Then
node = list.Item(i)
Exit For
End If
Next
list = node.ChildNodes()
For i As Integer = 0 To list.Count - 1
Console.WriteLine(list.Item(i).LocalName())
Next
reader.Close()
End Sub

https://www.uscis.gov/system/files_force/files/form/i-9.pdf?download=1

上面的链接转到政府提供的 i9 PDF。

所以...我想我有多个问题。最简单的是是否有人完成了这个过程/他们是否可以帮助我。除此之外,如果有人能为我指出正确的方向,说明如何从这个新的 PDF 文件中读取/写入,那将是惊人的。坦率地说,我什至不确定如何确定他们使用的是什么“类型”的表单 - AcroFieldXFA 还是其他?

非常感谢您的时间/帮助!

最佳答案

首先,抱歉我不再做vb.net了,但是你应该可以转换后面的代码。

您自己已经发现新表单是 XFA。有一种简单的非编程方式可以查看表单字段和数据。您注意到您升级了 Adob​​e Reader 的版本,所以我猜您正在使用 Reader DC。从菜单选项:

Edit => Form Options => Export Data...

将表单导出到您可以检查的 XML 文件。 XML 文件提示您需要相应的 XML 文档来填写表单,这与使用 AcroForm 完成的方式完全不同。

这里有一些简单的代码可以帮助您入门。首先是读取空白 XML 文档并更新它的方法:

public string FillXml(Dictionary<string, string> fields)
{
// XML_INFILE => physical path to XML file exported from I-9
XDocument xDoc = XDocument.Load(XML_INFILE);
foreach (var kvp in fields)
{
// handle multiple elements in I-9 form
var elements = xDoc.XPathSelectElements(
string.Format("//{0}", kvp.Key)
);
if (elements.Count() > 0)
{
foreach (var e in elements) { e.Value = kvp.Value; }
}
}

return xDoc.ToString();
}

现在我们有了创建有效 XML 的方法,用一些示例数据填充表单字段:

var fields = new Dictionary<string, string>()
{
{ "textFieldLastNameGlobal", "Doe" },
{ "textFieldFirstNameGlobal", "Jane" }
};
var filledXml = FillXml(fields);

using (var ms = new MemoryStream())
{
// PDF_READER => I-9 PdfReader instance
using (PDF_READER)
{
// I-9 has password security
PdfReader.unethicalreading = true;
// maintain usage rights on output file
using (var stamper = new PdfStamper(PDF_READER, ms, '\0', true))
{
XmlDocument doc = new XmlDocument();
doc.LoadXml(filledXml);
stamper.AcroFields.Xfa.FillXfaForm(doc.DocumentElement);
}
}
File.WriteAllBytes(OUTFILE, ms.ToArray());
}

要回答您的最后一个问题,即如何确定表单“类型”,请像这样使用 PdfReader 实例:

PDF_READER.AcroFields.Xfa.XfaPresent

true 表示 XFA,false 表示 AcroForm。

关于xml - 自动填写 I-9 PDF XFA 表格,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41510154/

31 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com