gpt4 book ai didi

c# - 从代码进行外部网站搜索

转载 作者:搜寻专家 更新时间:2023-10-30 20:31:14 25 4
gpt4 key购买 nike

我有一个包含姓氏、名字和邮政编码的 csv 文件。我想写一个 .NET 程序自动在 www.canada411.com 上搜索此人的邮政编码和姓氏,并将所有结果记录在数据库中。

我不知道该怎么做,但这些是我需要做的步骤:

  1. 阅读文件(我能做到)
  2. 使用文件中的信息搜索 www.canada411.com(不知道该怎么做)
  3. 识别页面的结果部分(不知道该怎么做)
  4. 对于搜索的每个结果,读取结果(不知道如何做)并存储在数据库中(我可以做最后一点)。

你能帮我指明正确的方向吗?非常感谢

最佳答案

您指的是屏幕抓取,这是一种将网页结果解析为有意义信息的高度不可靠的方法。

您最好找到一个“后代码查找服务”,该服务公开一个 API 用于以编程方式检索此信息。这样您的代码就不会因为提供商更改其网页设计而中断。

但是,要实现您的要求,您可以使用 WebClient 或构造一个 HttpWebRequest。然后,您可以解析响应以找到您感兴趣的 html 区域。

使用 HttpWebRequest 的示例 - http://wiki.asp.net/page.aspx/285/httpwebrequest/
解析 html 的最佳工具 - http://htmlagilitypack.codeplex.com/

关于c# - 从代码进行外部网站搜索,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6511625/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com