c# - 如何从 pdf 文件中提取附件？-6ren

c# - 如何从 pdf 文件中提取附件？

转载作者：太空狗更新时间：2023-10-29 17:37:15

24

4

我有大量附有 xml 文件的 pdf 文档。我想提取那些附加的 xml 文件并阅读它们。我如何使用 .net 以编程方式执行此操作？

最佳答案

iTextSharp 也非常有能力提取附件...尽管您可能必须使用低级对象来执行此操作。

有两种方法可以在 PDF 中嵌入文件:

在文件注释中
在文档级别“EmbeddedFiles”。

一旦您从任一来源获得文件规范字典，文件本身将成为标有“EF”(嵌入式文件)的字典中的一个流。

因此，要在文档级别列出所有文件，可以这样编写代码(用 Java):

Map<String, byte[]> files = new HashMap<String,byte[]>();

PdfReader reader = new PdfReader(pdfPath);
PdfDictionary root = reader.getCatalog();
PdfDictionary names = root.getAsDict(PdfName.NAMES); // may be null
PdfDictionary embeddedFilesDict = names.getAsDict(PdfName.EMBEDDEDFILES); //may be null
PdfArray embeddedFiles = embeddedFilesDict.getAsArray(PdfName.NAMES); // may be null

int len = embeddedFiles.size();
for (int i = 0; i < len; i += 2) {
  PdfString name = embeddedFiles.getAsString(i); // should always be present
  PdfDictionary fileSpec = embeddedFiles.getAsDict(i+1); // ditto

  PdfDictionary streams = fileSpec.getAsDict(PdfName.EF);
  PRStream stream = null;

  if (streams.contains(PdfName.UF))
    stream = (PRStream)streams.getAsStream(PdfName.UF);
  else
    stream = (PRStream)streams.getAsStream(PdfName.F); // Default stream for backwards compatibility

  if (stream != null) {
    files.put( name.toUnicodeString(), PdfReader.getStreamBytes((PRStream)stream));
  }
}

关于c# - 如何从 pdf 文件中提取附件？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/6305505/

24

4

0

文章推荐： angular - 使用 Observable 或 Observable 发出 `null` 值？

文章推荐： python - 在 python 中，如何将列表的多个值同时设置为零？

文章推荐： c# - 如何为 WMI 查询设置超时？

couchdb - 如何从浏览器上传文件(附件)？
我没有上传附件以使浏览器正常工作。一些提示是 here , 其他 there . The docs非常好，但我无法将其转换为 AJAX 上传。我正在寻找一个 super 简单的 HTML/Java
Android:将简单文本共享为文件/附件
我有一个应用程序可以收集一些信息并允许用户使用 Android 的 Intent 框架共享这些信息。到目前为止，它以纯文本形式共享报告:使用 putExtra(Intent.EXTRA_TEXT,
javascript - Yammer 附件
我正在尝试通过我的应用程序发布带有附件图片的消息，所以我使用了以下代码: function yamPost(mytoken) { var msg_Body = jQuery("#myB
mysql - 如何在关注或取消关注之前检查用户是否正在关注另一个用户(附件)
我在用户表中使用了多对多关系来使登录用户关注另一个用户，但我自己没有弄清楚，我检查了其他人做了什么，并尝试做类似的事情，并且它有效。在我的方法中，我有: function follow(User $u
php - IMAP 附件
我正在用 PHP 创建脚本，其作用是将 IMAP 服务器备份到 MySQL 数据库。我现在的问题是: 如果电子邮件有附件，附件是嵌入在电子邮件本身中还是服务器上的一个单独文件？我问的原因是: 我可
c# - RavenDB 附件
我正在使用 RavenDB，在我处理任何附件之前删除了一些带有附件的测试文档，所以我在想它们是否还在磁盘上的某个地方，以及如何轻松地找到它们?。另一个问题是:当文档被删除时，它有一个附件，附件会被自
Android ACTION_SEND 附件
当您使用 ACTION_SEND Intent (使用额外的 EXTRA_STREAM)将文件附加到电子邮件时，电子邮件应用程序是否将该附加文件复制到它自己的位置？我的应用程序创建了一个文件并将其附加
PHPMailer 附件，在没有物理文件的情况下执行
所以: // Setup mail class, recipients and body $mailer->AddAttachment('/home/mywebsite/public_html/fil
JavaFX - Outlook 附件 - DnD
您好，我需要一个 DnD 解决方案来将 Outlook 邮件附件拖到 Stackpane。 JavaFX/展望 2010 stackpaneDragAndDropZone.setOnDragO
php - 在电子邮件中添加 PhpSpreadsheet 附件
我尝试制作一个 PhpSpreadsheet 文档，然后将他添加到邮件附件中。也许是太热了，但在 phpSpreadsheet 文档中几个小时后，我还没有找到任何东西。这是我发送邮件的文件 $nam
iphone - 以动画方式删除 UITableViewCell 附件
有什么方法可以动画删除 UITableView 单元格附件吗？我当前正在显示一个 UITableViewCellAccessoryDisclosureIndicator，但我想在所有可见表格单元格上
iphone - 以编程方式通过电子邮件发送 iPhone 附件
我正在编写一个 iPhone 应用程序，它要求我以编程方式发送电子邮件附件。附件是我通过代码创建的 csv 文件。然后，我将文件附加到电子邮件中，附件就会显示在手机上。但是，当我向自己发送电子邮件时，
vba - 在本地目录中创建文件夹后保存 Outlook 附件
我正在尝试通过收件箱中的名称“MacroEnabled”访问子文件夹，找到其中的所有附件并将它们保存到本地驱动器。我使用此代码创建一个名为“Documents”的文件夹并保存附件。然而，在进行第二次
kotlin - 找不到流量的契约(Contract)附件
将 corda 升级到版本 4 后，我收到 net.corda.core.transactions.MissingContractAttachments:找不到 com.template.contra
email - Jenkins 附件-语法是什么？
我正在尝试让 Jenkins 将一个或一组文件附加到作业已完成的电子邮件通知中。我不断收到以下错误: 发送电子邮件以触发:成功错误:访问要附加的文件时出错:需要 Ant GLOB 模式，但看到 C:\
ios - UITableView 附件 View
我创建了一个由来自 mysql 的数据填充的 UITableView(使用 NSJSONSERIALIZATION)。现在问题是一回事。我检索到的是产品名称。我想要一个附件 View (像单元格右侧的
JavaMail 无法读取 XML 附件
我开发了一个 Java 客户端应用程序，用于下载我自己的电子邮件。我发现我无法在电子邮件中找到某些附件，特别是当我向经过认证的公司发送电子邮件时收到的作为收据的 XML 文件。我用于下载附件的代码:
rest - 如何批量上传 Couchdb 附件？
我正在将我的 sqlite 数据库转换为 Couchdb。我可以转换数据库并上传到 Couchdb 服务器。除了图像之外的一切。我想将图像作为独立附件上传，我想使用 javascript、REST 和
java - 电子邮件 Java 附件
我编写了一段代码，以便能够启动默认的电子邮件服务提供商，即我的 Outlook。这是我的代码: if(role.getValue().equals("1")) { Desktop desktop =
python - 如何下载 Gmail 附件？
我正在尝试使用链接上共享的代码使用 python 从 Gmail 下载电子邮件附件 https://gist.github.com/baali/2633554 我想应用时间过滤器+主题过滤器并下载附件

首页

博学

6Ren·AI

商城

c# - 如何从 pdf 文件中提取附件？