gpt4 book ai didi

c# - 在 C# 中使用 abcpdf 从 PDF A/3 中提取嵌入的 XML 文件 - ZUGFeRD

转载 作者:太空宇宙 更新时间:2023-11-03 16:00:25 25 4
gpt4 key购买 nike

我目前正在使用新的德语 ZUGFeRD 文件。这些是 PDF A/3 文件,其中包含包含数据的嵌入式 XML 文件。

我想使用带有 C# 的 abcpdf 8.1 从 PDF A/3 中提取这个 XML 文件。

知道怎么做吗?

非常感谢和问候,

最佳答案

我不知道 abcpdf,但我猜 pdf 库提供了对 pdf 内容的类似访问。

先看看Das-ZUGFeRD-Format_1p0.pdf .特别是第 112 页。图像显示了您必须遍历以找到 xml 流的对象树。

有了这棵树,您就有了名称、类型和方向。现在您可以遍历 pdf 对象树以找到您要查找的 XML 内容。

基于图表的步骤。

  1. 阅读您的 PDF
  2. 获取 PDF 中的目录
  3. 从目录中获取名称为 AF 的数组
  4. AF 数组中获取第一个元素(应该是 file spec)
  5. file spec 获取名为 EF 的字典
  6. 获取EF的流内容

这是获取内容所需执行的步骤。

要显示 pdf 的结构并浏览树,我建议使用像 iText RUPS 这样的工具

关于c# - 在 C# 中使用 abcpdf 从 PDF A/3 中提取嵌入的 XML 文件 - ZUGFeRD,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21698794/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com