- xml - AJAX/Jquery XML 解析
- 具有多重继承的 XML 模式
- .net - 枚举序列化 Json 与 XML
- XML 简单类型、简单内容、复杂类型、复杂内容
早上好。我希望有人可以帮助我解决这个问题。去年,我使用 iTextSharp
设置了一个 VB.NET 程序,用户可以在其中输入信息以填写 I9,该信息将填写 PDF 并打印。对于新的 I9,我遇到了未知的困难。
首先,代码不会出错。我只是得到了一个糟糕的结果,因为我得到的不是填写的表格,而是一个 PDF,上面写着“您要加载的文档需要 Adobe Reader 8 或更高版本。您可能没有安装 Adobe Reader ...”等等。所以,我确保我拥有最新的 Reader 版本,再次尝试并得到相同的结果。
考虑到字段名称结构可能发生了变化,我尝试像第一次那样读取格式/字段。 (下面的代码)。但是,现在它告诉我没有要读取的字段 (AcroFields.Fields.Count = 0
)。
Private Sub ListFieldNames(pdfTemplate As String)
Dim pdfTemplate As String = "c:\Temp\PDF\fw4.pdf"
Dim pdfReader As PdfReader = New PdfReader(pdfTemplate)
Dim de As KeyValuePair(Of String, iTextSharp.text.pdf.AcroFields.Item)
For Each de In pdfReader.AcroFields.Fields
Console.WriteLine(de.Key.ToString())
Next
End Sub
因此,我开始进行一些搜索,并找到了他们可以切换到的另一种 PDF 结构的引用; XFA。老实说,我还没有找到任何令人满意的文档/样本,但我确实找到了一些代码,看起来应该可以读取 XFA PDF 的结构。 (下面的代码)。我在这里尝试了两种不同的方法。第一个本质上表明 xfaFields 中没有 xmlNode。第二个确实找到了一个名为“数据”的节点(这是它找到的唯一一个)但没有找到任何子节点。
Private Sub ReadXfa(pdfTemplate As String)
pdfReader.unethicalreading = True
Dim readerPDF As New PdfReader(pdfTemplate)
Dim xfaFields = readerPDF.AcroFields.Xfa.DatasetsSom.Name2Node
For Each xmlNode In xfaFields
Console.WriteLine(xmlNode.Value.Name + ":" + xmlNode.Value.InnerText)
Next
'Example of how to get a field value
' Dim lastName = xfaFields.First(Function(a) a.Value.Name = "textFieldLastNameGlobal").Value.InnerText
Dim reader As New PdfReader(pdfTemplate)
Dim xfa As New XfaForm(reader)
Dim node As XmlNode = xfa.DatasetsNode()
Dim list As XmlNodeList = node.ChildNodes()
For i As Integer = 0 To list.Count - 1
Console.WriteLine(list.Item(i).LocalName())
If "data".Equals(list.Item(i).LocalName()) Then
node = list.Item(i)
Exit For
End If
Next
list = node.ChildNodes()
For i As Integer = 0 To list.Count - 1
Console.WriteLine(list.Item(i).LocalName())
Next
reader.Close()
End Sub
https://www.uscis.gov/system/files_force/files/form/i-9.pdf?download=1
上面的链接转到政府提供的 i9 PDF。
所以...我想我有多个问题。最简单的是是否有人完成了这个过程/他们是否可以帮助我。除此之外,如果有人能为我指出正确的方向,说明如何从这个新的 PDF 文件中读取/写入,那将是惊人的。坦率地说,我什至不确定如何确定他们使用的是什么“类型”的表单 - AcroField
、XFA
还是其他?
非常感谢您的时间/帮助!
最佳答案
首先,抱歉我不再做vb.net了,但是你应该可以转换后面的代码。
您自己已经发现新表单是 XFA。有一种简单的非编程方式可以查看表单字段和数据。您注意到您升级了 Adobe Reader 的版本,所以我猜您正在使用 Reader DC。从菜单选项:
Edit => Form Options => Export Data...
将表单导出到您可以检查的 XML
文件。 XML 文件提示您需要相应的 XML 文档来填写表单,这与使用 AcroForm 完成的方式完全不同。
这里有一些简单的代码可以帮助您入门。首先是读取空白 XML 文档并更新它的方法:
public string FillXml(Dictionary<string, string> fields)
{
// XML_INFILE => physical path to XML file exported from I-9
XDocument xDoc = XDocument.Load(XML_INFILE);
foreach (var kvp in fields)
{
// handle multiple elements in I-9 form
var elements = xDoc.XPathSelectElements(
string.Format("//{0}", kvp.Key)
);
if (elements.Count() > 0)
{
foreach (var e in elements) { e.Value = kvp.Value; }
}
}
return xDoc.ToString();
}
现在我们有了创建有效 XML 的方法,用一些示例数据填充表单字段:
var fields = new Dictionary<string, string>()
{
{ "textFieldLastNameGlobal", "Doe" },
{ "textFieldFirstNameGlobal", "Jane" }
};
var filledXml = FillXml(fields);
using (var ms = new MemoryStream())
{
// PDF_READER => I-9 PdfReader instance
using (PDF_READER)
{
// I-9 has password security
PdfReader.unethicalreading = true;
// maintain usage rights on output file
using (var stamper = new PdfStamper(PDF_READER, ms, '\0', true))
{
XmlDocument doc = new XmlDocument();
doc.LoadXml(filledXml);
stamper.AcroFields.Xfa.FillXfaForm(doc.DocumentElement);
}
}
File.WriteAllBytes(OUTFILE, ms.ToArray());
}
要回答您的最后一个问题,即如何确定表单“类型”,请像这样使用 PdfReader
实例:
PDF_READER.AcroFields.Xfa.XfaPresent
true
表示 XFA,false
表示 AcroForm。
关于xml - 自动填写 I-9 PDF XFA 表格,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41510154/
我是一名优秀的程序员,十分优秀!