gpt4 book ai didi

C#:HtmlAgilityPack 提取内部文本

转载 作者:太空狗 更新时间:2023-10-29 19:57:45 24 4
gpt4 key购买 nike

我正在使用 HtmlAgilityPack。是否有一行代码可以获取 html 的所有内部文本,例如,删除所有 html 标签和脚本?

最佳答案

像这样:

document.DocumentNode.InnerText

注意这会返回<script>的文本内容标签。

要解决这个问题,您可以删除所有 <script>标签,像这样:

foreach(var script in doc.DocumentNode.Descendants("script").ToArray())
script.Remove();
foreach(var style in doc.DocumentNode.Descendants("style").ToArray())
style.Remove();

关于C#:HtmlAgilityPack 提取内部文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2785092/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com