gpt4 book ai didi

c# - 解析 HTML/CSS/PHP 文件

转载 作者:太空宇宙 更新时间:2023-11-04 16:27:22 26 4
gpt4 key购买 nike

我需要某种库,可能是 HTMLAgilityPack?可以解析 HTML 文件和 CSS 文件。但这有点棘手,因为 HTML(PHP) 文件中可能包含 PHP 代码,也可能包含 CSS 代码,所以我根本无法在没有某些人帮助的情况下尝试自己解决这个问题图书馆。

我将 C#/WinForms 与 Visual Studio Express 2010 一起使用。到目前为止,我唯一能找到的是 HTML AgilityPack,它没有我能找到的文档,而且我不确定它是否能满足我的所有需求做。

我的确切要求是找到一种方法来解析 HTML 文件,遍历每个标签,获取其内容,获取所有属性和值等,并对每个标签执行一些操作。

你以前见过这样的图书馆吗?有人可以就如何解决这个问题提供一些帮助/建议吗?我并不是真的在寻找完美,只是在寻找简单性和多样性。

最佳答案

HTML Agility Pack 将允许您按照您的描述遍历元素。文档有点薄,但它是在 XmlDocument 类之后建模的,这大大简化了学习曲线。使用 XPath 查询选择元素。有一个用法的小例子 here .

下面是一些遍历 HTML 文档中所有元素的示例代码(注意这包括文本元素、<style> 元素等):

var doc = new HtmlAgilityPack.HtmlDocument();
doc.LoadHtml(someHtmlString);

foreach (HtmlNode node in doc.DocumentNode.SelectNodes("*") ?? Enumerable.Empty<HtmlNode>()) {
var contents = node.InnerHtml;
foreach (var attribute in node.Attributes) {
var name = attribute.Name;
var value = attribute.Value;
}
}

This question解释如何处理 PHP 标记(您可能想要忽略或提取它们)。

关于c# - 解析 HTML/CSS/PHP 文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5268919/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com