gpt4 book ai didi

c# - 使用C#从Html页面中提取字符串

转载 作者:行者123 更新时间:2023-11-29 10:56:57 25 4
gpt4 key购买 nike

我有一个源 html 页面,我想要执行以下操作:

  1. 从整个 html 页面中提取特定字符串并将新选择的字符串保存在新的 html 页面中。
  2. 在 MySQL 上创建一个包含 4 列的数据库。
  3. 将html页面中的数据导入到MySql上的表中。

如果有人能在这方面帮助我,我将非常感激,因为我没有使用 C# 的完美知识。

最佳答案

您可以使用此代码:

HttpClient http = new HttpClient();

//I have put Ebay.com. you could use any.
var response = await http.GetByteArrayAsync("ebay.com");
String source = Encoding.GetEncoding("utf-8").GetString(response, 0, response.Length - 1);
source = WebUtility.HtmlDecode(source);
HtmlDocument Nodes = new HtmlDocument();
Nodes.LoadHtml(source);

在 Nodes 对象中,您将拥有 HTML 页面中的所有 DOM 元素

您可以使用 linq 过滤掉您需要的任何内容。

示例:

List<HtmlNode> RequiredNodes = Nodes.DocumentNode.Descendants()
.Where(x => x.Attributes["Class"].Contains("List-Item")).ToList();

您可能需要安装 Html Agility Pack NuGet 或从链接下载。

希望这有帮助。

关于c# - 使用C#从Html页面中提取字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42885941/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com