gpt4 book ai didi

linux - 使用 node.js 解析 word 文档中的表格

转载 作者:搜寻专家 更新时间:2023-11-01 00:02:50 31 4
gpt4 key购买 nike

我正在尝试创建一个由 Linux 服务器托管的 node.js 网络应用程序。该应用程序必须读取和解析 word 文档 中的表格。

我环顾四周,发现 Powershell 可以 trivially完成这个。问题是 Powershell 是一种 MS 脚本语言,它的 Mac 端口 ( pash ) 非常不稳定并且 chokes每当我想执行像这样简单的事情时:

$wd = New-Object -ComObject Word.Application
$wd.Visible = $true
$doc = $wd.Documents.Open($filename)
$doc.Tables | ForEach-Object {
$_.Cell($_.Rows.Count, $_.Columns.Count).Range.Text
}

我研究过其他解决方案,例如 Docsplit而且它太通用了(即它将整个 Word 文档转换为纯文本,对于我的目的来说不够精细)。

一些suggested使用 saaspose API,但要花很多钱!我想我自己可以做到。

想法?

最佳答案

这是一个可以读/写 docx 文件的 python 模块:

https://github.com/mikemaccana/python-docx

关于linux - 使用 node.js 解析 word 文档中的表格,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15769352/

31 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com