gpt4 book ai didi

html - 如何对 DOC/DOCX 转换为 HTML 进行后期格式化?

转载 作者:搜寻专家 更新时间:2023-10-31 21:52:02 24 4
gpt4 key购买 nike

我目前正在使用 OpenOffice (命令行)和 JODConvertor将我托管的 Web 应用程序的 Word 文档(.doc 和 .docx)转换为 HTML。它工作得很好,除了一个问题——HTML 文件的边距格式不正确。更糟糕的是,利润率在操作系统(MacOS 和 Windows)和浏览器之间不一致。

是否有其他工具可以进行后期格式化(我认为它涉及重写转换后的 HTML 文档的 CSS),就像 Google Docs 一样?

我不想成为另一个 Google 文档,我只是想模仿他们的后期格式化过程(更具体地说,边距宽度格式化),这样我就可以让用户在我自己的服务上上传和存储 HTML 文档。我需要它是一个独立于任何第三方网站的自动化过程(我知道谷歌有一个 API,称为 googlecl,但它需要身份验证,并且你变得依赖于他们的服务器和服务;更不用说你有配额).

如果有人知道 OpenOffice 路线以外的任何其他方法,我愿意接受建议。

最佳答案

看来您最好的选择是向 JODConverter 添加一个功能,允许您在导出期间插入自己的 CSS。所有页面都类似于以下内容:

body {
margin: 50px !important;
}

要么说服 JODConverter 的维护者,要么抓取代码并自己破解。祝你好运。

关于html - 如何对 DOC/DOCX 转换为 HTML 进行后期格式化?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6245288/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com