gpt4 book ai didi

c# - 如何使用 C# 在本地自动获取在线 HTML 表

转载 作者:太空狗 更新时间:2023-10-29 14:54:10 24 4
gpt4 key购买 nike

可以保持简短:

我有一些不同的网站,其中的表格包含我希望“本地”查询的信息。

我一直在寻找可能性,我自己也有一些想法。

  1. 在 Excel 中,我发现了一个功能,我可以通过它导航到网页并从表格中复制数据。问题是这只会发生一次。表格中的数据将每周更新一次,因此我需要每次打开我的程序时自动更新 Excel。

  2. 我可以使用爬虫,但这样我就必须为每个表编写不同的解决方案并找到保存它的方法。

我有一个 MySQL 数据库,它包含我在我的程序中需要的许多信息,所以如果任何解决方案需要一个完全可以接受的数据库。

关于我的程序:将用 C# 编写,首先作为本地程序,然后到 MVC 项目。非常欢迎对这两个项目提出建议,如果您需要更多信息,请评论,我会尝试更多地描述它。 :)

编辑! 1

我很抱歉,我没有从一开始就告诉你我在谈论哪些表,但是当我开始这个问题时,我仍然需要找到所有的表。然而,现在我已经拿出其中的一些来向你们展示我必须使用的不同类型的表格。关于项目,应该告诉你,我打算制作的程序只供自用,不出售。我不知道在公共(public)站点上抓取的规则,所以这就是我将其保密的原因。

Table 2 Table 3

如您所见,很多足球数据以非常不同的方式显示,所以我需要知道哪种方式最适合我收集数据,因为我相信利用这些知识设计医学数据库会更容易。

最佳答案

Anders,Excel 有一种获取数据的内置方法,您必须执行一次。下次您只需刷新查询即可。请查看此链接。

html parsing of cricinfo scorecards

跟进

Try look at this page: soccernet.espn.go.com/stats/_/league/eng.1/… There are 3 tables but it dosent seem that excel detect them. :( – Anders Gerner 7 mins ago

在这个特定的网站中,如果您查看源代码,您会看到该表没有 ID。所有三个表都有相同的类“tablehead”。如果需要,在工作簿打开事件中,遍历所有表并提取数据。您的工作变得更加轻松,因为所有 3 个表都具有相同的类。

或者,你也可以这样做

在 Excel 中,单击文件 | 打开,然后在对话框中直接输入您在下面提到的 URL。您会注意到 Excel 整齐地堆叠数据 :)

您实际上可以编写一个小的宏/代码来打开一个临时工作簿,然后打开 URL,然后简单地将临时工作簿中的表格提取到您的工作簿中。我的估计是,在良好的互联网连接下,完成整个过程的时间不应超过 15 秒

关于c# - 如何使用 C# 在本地自动获取在线 HTML 表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9269875/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com