gpt4 book ai didi

javascript - 上传后无法读取.docx文件(nodejs)

转载 作者:太空宇宙 更新时间:2023-11-04 03:21:04 26 4
gpt4 key购买 nike

因此,我尝试使用 express-fileupload 包将 .docx 文件上传并读取到 Express 服务器。上传部分工作正常,但不知何故我无法读取该文件,因为它打印了不可读的乱码文本。代码如下:

app.post('/upload', (req, res, next) => {
let file = req.files.file;

file.mv(`${__dirname}/public/${req.body.filename}`, function(err) {
if (err) {
return res.status(500).send(err);
}

fs.readFile(`${__dirname}/public/${req.body.filename}`, 'utf8', function (err,data) {
if (err) {
return console.log(err);
}
console.log(data) // prints broken text/gibberish;
});

res.json({data to be returned});
});

});

我想要的是能够读取.docx文件并对其中的文本进行操作。

最佳答案

docx 文件不包含人类可读的文本。它们实际上是包含许多不同 XML 文件的 ZIP 文件 - 但即使是 XML 文件的文本内容也不容易使用。

如果您想读取甚至修改 docx 文件中的文本,您需要找到一个可以读/写该格式的库。

关于javascript - 上传后无法读取.docx文件(nodejs),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50238661/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com