gpt4 book ai didi

c# - 解析 Html 文档获取所有具有 ID 和值的输入字段

转载 作者:太空狗 更新时间:2023-10-30 00:41:27 25 4
gpt4 key购买 nike

我有几千张(ASP.net - 乱七八糟的 html)html 生成的发票,我正在尝试解析这些发票并将其保存到数据库中。

基本上像:

 foreach(var htmlDoc in HtmlFolder)
{
foreach(var inputBox in htmlDoc)
{
//Make Collection of ID and Values Insert to DB
}
}

来自所有其他questions我读过解决此类问题的最佳工具是 HtmlAgilityPack ,但是对于我来说,我无法使文档 .chm 文件正常工作。关于如何使用或不使用 Agility Pack 来完成此任务,我有什么想法吗?

提前致谢

最佳答案

HtmlAgilityPack 的更新替代品是 CsQuery .看这个later关于它的相对性能优点的问题,但它对 CSS 选择器的使用是无与伦比的:

var doc = CQ.CreateDocumentFromFile(htmldoc); //load, parse the file
var fields = doc["input"]; //get input fields with CSS
var pairs = fields.Select(node => new Tuple<string, string>(node.Id, node.Value()))
//get values

关于c# - 解析 Html 文档获取所有具有 ID 和值的输入字段,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20641030/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com