gpt4 book ai didi

javascript - node.js 如何使用 url 作为 pdf 路径来使用 pdf2json

转载 作者:搜寻专家 更新时间:2023-10-31 23:45:36 24 4
gpt4 key购买 nike

我正在使用 node.js 和 pdf2json 解析器来解析 pdf 文件。目前它正在使用本地 pdf 文件。但是我想通过 node.js 的 URL/HTTP 模块获取一个 pdf 文件,我想打开这个文件来解析它。

是否有可能解析/使用在线 pdf?

let query   = url.parse(req.url, true).query;
let pdfLink = query.pdf;
...
pdfParser.loadPDF(pdfLink + "");

所以url应该通过url给定:https://localhost:8080/?pdf=http://whale-cms.de/pdf.pdf

有没有办法在在线pdf/链接中解析它?

提前致谢。

最佳答案

我刚遇到同样的问题,并找到了解决方案:

        var request = require('request');
var PDFParser = require("pdf2json");
var pdfUrl = "http://localhost:3000/cdn/storage/PDFFiles/sk87bAfiXxPre428b/original/sk87bAfiXxPre428b"
var pdfParser = new PDFParser();

var pdfPipe = request({url: pdfUrl, encoding:null}).pipe(pdfParser);

pdfPipe.on("pdfParser_dataError", err => console.error(err) );
pdfPipe.on("pdfParser_dataReady", pdf => {
let usedFieldsInTheDocument = pdfParser.getAllFieldsTypes();
console.log(usedFieldsInTheDocument)
});

来源: https://github.com/modesty/pdf2json/issues/65
干杯

关于javascript - node.js 如何使用 url 作为 pdf 路径来使用 pdf2json,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45055125/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com