作者热门文章
- xml - AJAX/Jquery XML 解析
- 具有多重继承的 XML 模式
- .net - 枚举序列化 Json 与 XML
- XML 简单类型、简单内容、复杂类型、复杂内容
有人知道我可以在 OS X/Linux 上使用的库来解析 Word 文件并将内容输出为 HTML 吗?
我看过 win32ole,但据我所知,它仅适用于 Windows,尽管我可能错了。
有什么建议吗?
最佳答案
Word 文档格式(暂时忽略 docx)很糟糕,而且一直在变化。恕我直言,这就是为什么很少(阅读:零)Ruby 库可以解析它们。
我推荐的做法是使用 JRuby 和一些已建立的 Java 库来阅读文档格式。 Google 应该可以帮助您:http://schmidt.devlib.org/java/libraries-word.html .
有一个用于读取 MIcrosoft 文件格式的 Java 项目 POI ( http://poi.apache.org/ ),它们确实有 Ruby 绑定(bind) ( http://poi.apache.org/poi-ruby.html ),但我不确定它们的更新程度。在他们的网站上说 Ruby 绑定(bind)适用于 1.8.2...
关于ruby - 如何用ruby解析word文档?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/375861/
我是一名优秀的程序员,十分优秀!