gpt4 book ai didi

javascript - 从 html 中剥离邮件正文,并使用 Javascript 保留格式

转载 作者:太空宇宙 更新时间:2023-11-04 13:01:39 26 4
gpt4 key购买 nike

我有一个邮件内容,可能包含 html/css。我想清除标签、图像中的文本,但想保留格式,这样它仍然足够可读。

架构是:

1)从服务器获取电子邮件;

2)将其存储到数据库中;

3)通过Spring后端向网页请求获取

4)显示它已从 html/css 标签中清理出来,只是纯文本,其中将包含换行符、空格和一些基本格式。

这段代码帮助我摆脱了 html 标签,但所有文本都变得可读性很强。

var htmlToPlaintext = function(text) {
return text ? String(text).replace(/<[^>]+>/gm, '') : '';
};

关于如何达到预期结果有什么建议吗?

P.S.:如果需要,我可以在 java 后端预处理数据。

谢谢!

最佳答案

我认为你应该让浏览器为你做这件事。

检查这个getText函数:

function getText(html)
{
var tmp = document.createElement("div");
tmp.innerHTML = html;
return tmp.textContent||tmp.innerText;
}
var html = document.getElementById("htmlDiv").innerHTML;
alert(getText(html))
<div id='htmlDiv'>
<div>this is first line. <span> another part</span></div>
<div>this is another line.
<p>
paragraph 1
</p>
<p>
paragraph 2
</p>
</div>
</div>

关于javascript - 从 html 中剥离邮件正文,并使用 Javascript 保留格式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34881606/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com