gpt4 book ai didi

C# 从网站抓取数据

转载 作者:太空宇宙 更新时间:2023-11-03 20:22:41 25 4
gpt4 key购买 nike

嗨,我是 C# 领域的新手。自今年年初以来一直在使用 php 和 JavaScript。我想从博客中删除帖子和评论。网址是http://www.somewhereinblog.net

我想做的是1.我想用软件登录2.然后下载html3.然后用正则表达式,xpath随便什么,把帖子和评论的内容分开

我一直在寻找。了解的很少。虽然我很确定我需要使用“htmlagilitypack”。我不知道如何将库添加到 C# 控制台或表单应用程序。有人可以帮我吗?我非常需要这个。我对 C# 的了解还不够一周。所以,如果有一些详细的信息,将不胜感激。热切期待。

先谢谢兄弟们

最佳答案

  1. 使用Webclient您可以登录并下载
  2. 我喜欢 html-agility-pack CsQuery因为允许您在 C# 代码中的字符串中使用 jQuery 语法,所以您可以将 html 下载到字符串中,然后在其中搜索和执行操作,就像使用 jQuery 和 HTML 页面一样。

关于C# 从网站抓取数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12524737/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com