作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我在一个文件夹中有大约 5000 个 html 文件。我需要遍历它们、打开、使用 xpath 获取 10 个值、关闭并存储在 (SQL Server) 数据库中。
使用 .Net 读取 xpath 值的最简单方法是什么?
xpath 应该非常稳定。
请提供读取一个值的示例代码,比如/html/head/title/text()
谢谢
最佳答案
我认为你应该查看 HTML Agility Pack .它是一个 HTML 解析器而不是 XML 解析器,更适合这项任务。如果有任何内容与正在解析的 XML 不一致,那么解析器将抛出异常。使用 HTML 解析器可以让您对输入文件有更多的余地。
显示如何使用所有 HREF(链接)属性执行操作的示例:
HtmlDocument doc = new HtmlDocument();
doc.Load("file.htm");
foreach(HtmlNode link in doc.DocumentElement.SelectNodes("//a[@href"])
{
HtmlAttribute att = link["href"];
att.Value = FixLink(att);
}
我不在编译器附近,但你想要的例子是这样的:
string title = doc.DocumentNode.SelectSingleNode("//title").InnerText;
关于.net - 如何从 .Net 中的许多 HTML 文件中读取 xpath 值?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3340047/
我是一名优秀的程序员,十分优秀!