gpt4 book ai didi

.net - 在 .NET 中从 HTML 获取纯文本

转载 作者:技术小花猫 更新时间:2023-10-29 11:55:16 25 4
gpt4 key购买 nike

从 HTML 字符串中获取纯文本字符串的最佳方法是什么?

public string GetPlainText(string htmlString)
{
// any .NET built in utility?
}

提前致谢

最佳答案

您可以使用 MSHTML,这非常宽容;

//using microsoft.mshtml
HTMLDocument htmldoc = new HTMLDocument();
IHTMLDocument2 htmldoc2 = (IHTMLDocument2)htmldoc;
htmldoc2.write(new object[] { "<p>Plateau <i>of<i> <b>Leng</b><hr /><b erp=\"arp\">2 sugars please</b> <xxx>what? &amp; who?" });

string txt = htmldoc2.body.outerText;

Plateau of Leng 2 sugars please what? & who?

关于.net - 在 .NET 中从 HTML 获取纯文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5870438/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com