gpt4 book ai didi

python - 将 HTML 标记转换为 RTF 文档

转载 作者:数据小太阳 更新时间:2023-10-29 02:30:22 25 4
gpt4 key购买 nike

我有一个包含嵌入式 HTML 内容的 XML 文档,我正试图将其转换为 RTF 输出文件。我有用 <li>, <p>, <b> 装饰的 XML 元素和其他 HTML 标记,我想将其转移到生成的 RTF 中。

这是目前有效的方法:

  1. 获取 XML 标记内容作为字符串(包含用于换行符、分段符和列表的 HTML 标记)
  2. 将XML标签内容写入RTF文件。

我正在使用 Python 脚本来实现转换。还使用了 ElementTree(解析输入 XML)PyRTF-NG(将 HTML 转换为 RTF),这是一个处理表格和其他特殊格式的库。目前,我已经设法获得了我需要的一切,除了 HTML 的“ Markdown ”(即将 HTML 格式标签转换为实际的 RTF 格式)。澄清一下,我的意思是如果我的 RTF 转换器遇到 <ol><li>标签,它应该在 RTF 中创建一个有序列表,而不是仅仅输出 <ol><li>标记到 RTF 中。

有谁知道 Python 是否有任何允许我执行此操作的 native 调用,或者是否有任何其他 Python 库可能具有完成完全转换为 RTF 所需的功能。

谢谢!

最佳答案

最好的free conversor是LibreOffice,可以在termimal直接通过命令行使用,看

libreoffice --convert-to

Python 使用 UNO 桥间接调用同一个转换器,

关于python - 将 HTML 标记转换为 RTF 文档,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22150695/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com