gpt4 book ai didi

ruby - 如何用ruby解析word文档?

转载 作者:数据小太阳 更新时间:2023-10-29 06:39:34 26 4
gpt4 key购买 nike

有人知道我可以在 OS X/Linux 上使用的库来解析 Word 文件并将内容输出为 HTML 吗?

我看过 win32ole,但据我所知,它仅适用于 Windows,尽管我可能错了。

有什么建议吗?

最佳答案

Word 文档格式(暂时忽略 docx)很糟糕,而且一直在变化。恕我直言,这就是为什么很少(阅读:零)Ruby 库可以解析它们。

我推荐的做法是使用 JRuby 和一些已建立的 Java 库来阅读文档格式。 Google 应该可以帮助您:http://schmidt.devlib.org/java/libraries-word.html .

有一个用于读取 MIcrosoft 文件格式的 Java 项目 POI ( http://poi.apache.org/ ),它们确实有 Ruby 绑定(bind) ( http://poi.apache.org/poi-ruby.html ),但我不确定它们的更新程度。在他们的网站上说 Ruby 绑定(bind)适用于 1.8.2...

关于ruby - 如何用ruby解析word文档?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/375861/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com