gpt4 book ai didi

C# - 在标记之间删除 HTML 源代码中的空格?

转载 作者:太空狗 更新时间:2023-10-29 22:11:34 24 4
gpt4 key购买 nike

我目前正在开发一个程序,该程序允许我将 HTML 源代码输入 RichTextBox 控件并删除标记之间的空格。唯一的问题是,我不确定如何区分标记之间的空格和标记内的空格。显然,删除标记内的空格是不好的。关于如何区分的任何想法?

示例:(删除空格之前)

<p>blahblahblah</p>                  <p>blahblahblah</p>

示例:(删除空格后)

<p>blahblahblah</p><p>blahblahblah</p>

最佳答案

Rasik 发送的链接中的解决方案 here这也是您的解决方案

Regex.Replace(html, @"\s*(<[^>]+>)\s*", "$1", RegexOptions.Singleline);

常规使用标记和周围的空格字符并用标记更改它。

编辑:适用于 Micheal 示例的更好解决方案

Regex.Replace(txtSource.Text,
@"\s*(?<capture><(?<markUp>\w+)>.*<\/\k<markUp>>)\s*", "${capture}", RegexOptions.Singleline);

这个正则表达式将检测标记标签并且不改变它里面的内容并删除外面的空格。还有一些其他情况也需要考虑。就像没有结束标签的标记。

关于C# - 在标记之间删除 HTML 源代码中的空格?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1691767/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com