gpt4 book ai didi

html - 将 MS Word 文本转换为普通有效的 html/css

转载 作者:太空狗 更新时间:2023-10-29 15:46:06 24 4
gpt4 key购买 nike

我正在寻找一种方法将几个段落和有序/无序列表从 MS Word 文件转换为 HTML。

现在,问题是当将 Word 文件另存为“htm/html”类型的文件时(我使用的是 Word 2010),我得到各种不需要的 CSS 指令,有些是 MS 发明的,有些是有效的 CSS,我不想在我的 html 代码中使用。此外,甚至更有问题的是,有序/无序列表甚至没有使用 LI 项编码为 OL 和 UL,而是编码为疯狂的 Microsofty 编码。

例如,一个段落(在 Word 中样式为“普通”)被转换为:

<p class=MsoNormal>
<span style='font-size:10.0pt;line-height:115%;mso-bidi-font-style:italic'>
bla bla </span></p>

我只是希望它是:

<p><span>bla bla</span></p>  

更可怕的是,一个带有一个列表项的简单的未排序列表(“元素符号列表”)被转换为:

<p class=MsoListParagraph style='text-indent:-18.0pt;mso-list:l0 level1 lfo1'>
<![if !supportLists]>
<span style='font-family:Symbol;mso-fareast-font-family:Symbol;mso-bidi-font-family:Symbol'>
<span style='mso-list:Ignore'>·
<span style='font:7.0pt "Times New Roman"'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;

</span></span></span><![endif]>
<span dir=LTR</span>Bla bla</p>

虽然我希望得到:

<ul><li>Bla bla</li></ul>

有什么想法吗?

非常感谢!

附注我正在使用 Zend Studio(也许有内置的 eclipse/zend 专用转换器或其他东西?)
附言我发现导出为 html 的唯一 MS Word 选项位于选项 => 高级 => 常规 => Web 选项中。使用这些选项并没有解决上述任何问题。

最佳答案

好的,找到了一个奇怪但有效的解决方案:

使用http://htmleditor.in/index.html和“从 Word 粘贴”选项,但是使用(具有讽刺意味的是!)Internet Explorer(使用 IE 9 测试)执行此操作。

原因是,当我使用 Chrome 完成这项工作时,在按下“从 Word 粘贴”时,一个 html div 类型的弹出窗口 询问我是否允许直接访问我的剪贴板数据,当根据需要使用 ctrl-v 粘贴文本,结果缺少元素符号(元素符号元素被转换为段落)。

相反,当我使用 IE 9 时,我得到的不是 div 类型的弹出窗口,而是 IE 系统类型的弹出窗口,粘贴在那里保留元素符号...

具有讽刺意味的是,为了解决一个始于 Microsoft 的问题,我使用了另一个 Microsoft 产品,可能是因为它的 html 兼容性差,却完全符合我的要求...大声笑。

关于html - 将 MS Word 文本转换为普通有效的 html/css,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17844506/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com