gpt4 book ai didi

pdf - 使用 C# 或经典 ASP (VBScript) 从 PDF 中提取文本的好方法是什么?

转载 作者:行者123 更新时间:2023-12-01 01:38:38 25 4
gpt4 key购买 nike

关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。












想改进这个问题?将问题更新为 on-topic对于堆栈溢出。

6年前关闭。




Improve this question




是否有用于从 PDF 中提取文本的好库?如果需要,我愿意为此付出代价。

与 C# 或经典 ASP (VBScript) 一起工作的东西是理想的,我还需要能够将页面与 PDF 分开。

This question有一些有趣的东西,尤其是 pdftotext但如果可以的话,我想避免调用外部命令行应用程序。

最佳答案

您可以使用 Windows 内置的 IFilter 接口(interface)从任何受支持的文件类型中提取文本和属性(作者、标题等)。它是一个 COM 接口(interface),因此您可以使用 .NET 互操作工具。

您还必须从 Adob​​e 下载免费的 PDF IFilter 驱动程序。

关于pdf - 使用 C# 或经典 ASP (VBScript) 从 PDF 中提取文本的好方法是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46869/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com