gpt4 book ai didi

c# - ASP.NET:如何从表格 html 源中提取特定值?

转载 作者:太空宇宙 更新时间:2023-11-03 14:04:15 24 4
gpt4 key购买 nike

我想提取 IMDb 的 Boxoffice 表中每一行的电影名称..

示例 html 表格行:

    <tr class="chart_even_row">

<td style="text-align: right;">
<b>1</b>
</td>
<td>
<img border="0" src="http://ia.media-imdb.com/images/M/MV5BMjA4NDg3NzYxMF5BMl5BanBnXkFtZTcwNTgyNzkyNw@@._V1._SY30_SX23_.jpg" width="20" height="30">
</td>
<td>

<a href="/title/tt1392170/" >The Hunger Games</a> (2012)
</td>
<td style="text-align: right; padding-right: 20px;">$155M
</td>
<td style="text-align: right;">
$155M
</td>
<td style="text-align: center;">
1
</td>

</tr>

我要提取的值是“The Hunger Games”..

我需要一个 C# 代码来为我实现这个。

注意:我想通过 REGEX 执行此操作

提前致谢,拉沙德。

最佳答案

屏幕抓取 IMDB 是复杂、脆弱且被禁止的。 IMDB 提供纯文本数据文件,您可以在 http://www.imdb.com/interfaces 上使用

更新

请允许我重申:屏幕抓取和数据挖掘 IMDB.com 违反了他们的使用条款。

关于正则表达式:see this answer .

因此,如果您执意要违反 IMDB 的使用条款,那么 HTML Agility Pack 可能是最好的选择。

关于c# - ASP.NET:如何从表格 html 源中提取特定值?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9874059/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com