gpt4 book ai didi

javascript - 如何只获取html标签?

转载 作者:行者123 更新时间:2023-12-02 16:09:08 26 4
gpt4 key购买 nike

如何使用 NodeJS 只获取 HTML 标签?

我有这个:

<html>
<head>
Hi
</head>
<body>
<center id="fantastic">
Hi , hello
</center>
</body>
</html>

我想删除 Hi 和 Hi , Hello 并只获取标签,我也想删除 id="fantastic"。任何想法?有正则表达式吗?

最佳答案

假设您的 Javascript 字符串中有源 HTML,并且它是合法的 HTML,并且 HTML 属性不包含“>”或“<”字符,则这应该有效:

var source = "your html here";

var result = source.match(/<.*?>/g).map(function(item) {
return item.replace(/<\s+/, "<").replace(/\s.*?(\/?>)$/, "$1");
}).join("");

工作演示:http://jsfiddle.net/jfriend00/6q0gyugd/

这使用正则表达式将 HTML 标记隔离到数组中,然后使用 .map() 迭代该数组以删除标记中的任何前导空格,然后删除其中的任何属性每个标签,然后将它们连接回 HTML 字符串。

<小时/>

为了成为任何可能的合法 HTML 中最强大的,您也可以使用实际的 HTML 解析器(它可能比任何正则表达式更智能)来解析实际的 HTML 标签,然后遍历解析的树来输出只是标签。

关于javascript - 如何只获取html标签?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30415192/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com