gpt4 book ai didi

javascript - 如何使用 pdf.js 从 pdf 文档获取元数据

转载 作者:搜寻专家 更新时间:2023-11-01 05:00:58 24 4
gpt4 key购买 nike

有没有办法使用 pdf.js 从 pdf 文档中获取作者或标题等元数据?

在这个例子中:http://mozilla.github.io/pdf.js/web/viewer.html?file=compressed.tracemonkey-pldi-09.pdf

<div class="row">
<span data-l10n-id="document_properties_author">
Autor:
</span>
<p id="authorField">
-
</p>

并且 authorField 是空的。有什么办法可以得到这些信息吗?

最佳答案

仅使用 PDF.js 库而不使用第三方查看器,您可以像这样使用 promises 获取元数据。

PDFJS.getDocument(url).then(function (pdfDoc_) {
pdfDoc = pdfDoc_;
pdfDoc.getMetadata().then(function(stuff) {
console.log(stuff); // Metadata object here
}).catch(function(err) {
console.log('Error getting meta data');
console.log(err);
});

// Render the first page or whatever here
// More code . . .
}).catch(function(err) {
console.log('Error getting PDF from ' + url);
console.log(err);
});

我在将 pdfDoc 对象转储到控制台并查看其功能和属性后发现了这一点。我在它的原型(prototype)中找到了这个方法,并决定试一试。瞧,它成功了!

关于javascript - 如何使用 pdf.js 从 pdf 文档获取元数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22743491/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com