gpt4 book ai didi

javascript - 从文本中消除特定模式

转载 作者:行者123 更新时间:2023-11-30 19:10:45 25 4
gpt4 key购买 nike

我有来自 API 的文本:

<p style="font-color:#000;font-weight:bold">Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore</p>
<p style="font-color:#000;font-weight:500">Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore</p>

我试图从文本中出现的任何位置消除 style="font-weight: bold ..etc",然后拆分段落并将它们放入一个数组中。我使用了 regexp 并尝试了很多,但我的尝试似乎都没有解决问题。

语言是javascript:

t1=text.replace(/^style*\"$/g, '')
t2=t1.split(/(<\/?p*>$)/gm)

最佳答案

如果这是浏览器端的 JavaScript,那么,正如@JamesCoyle 所建议的那样,最好使用 DOM 来执行此操作。

(在此处插入关于如何不应该使用正则表达式解析 HTML 的简单的 google 咆哮)

const html = '<p style="font-color:#000;font-weight:bold">Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore</p>\n<p style="font-color:#000;font-weight:500">Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore</p>'

extractParagraphTexts(html);

function extractParagraphTexts(html) {
const tempDiv = document.createElement("div");
tempDiv.innerHTML = html;

const result = [];
tempDiv.querySelectorAll("p").forEach(e => result.push(e.textContent));

return result;
}

关于javascript - 从文本中消除特定模式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58500011/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com