gpt4 book ai didi

javascript - 使用 JavaScript 清理 Microsoft Word 粘贴的文本

转载 作者:行者123 更新时间:2023-12-03 01:41:23 25 4
gpt4 key购买 nike

我正在使用“contenteditable”<div/>并启用粘贴。

从 Microsoft Word 的剪贴板副本粘贴的标记代码数量惊人。我正在与此作斗争,并且使用 Prototypes' stripTags() 已经完成了大约 1/2 的工作。函数(不幸的是,它似乎无法让我保留一些标签)。

但是,即使在那之后,我仍然得到了大量不需要的标记代码。

所以我的问题是,是否有一些函数(使用 JavaScript)或我可以使用的方法来清理大部分不需要的标记?

最佳答案

这是我最终编写的函数,它很好地完成了这项工作(据我所知)。

如果有人有任何改进建议,我当然愿意接受。谢谢。

function cleanWordPaste( in_word_text ) {
var tmp = document.createElement("DIV");
tmp.innerHTML = in_word_text;
var newString = tmp.textContent||tmp.innerText;
// this next piece converts line breaks into break tags
// and removes the seemingly endless crap code
newString = newString.replace(/\n\n/g, "<br />").replace(/.*<!--.*-->/g,"");
// this next piece removes any break tags (up to 10) at beginning
for ( i=0; i<10; i++ ) {
if ( newString.substr(0,6)=="<br />" ) {
newString = newString.replace("<br />", "");
}
}
return newString;
}

希望这对你们中的一些人有帮助。

关于javascript - 使用 JavaScript 清理 Microsoft Word 粘贴的文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2875027/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com