gpt4 book ai didi

c# - 用于 html 解析的正则表达式(在 c# 中)

转载 作者:太空狗 更新时间:2023-10-30 01:12:30 27 4
gpt4 key购买 nike

我正在尝试解析一个 html 页面并从表格行中提取 2 个值。表格行的html如下:-

<tr>
<td title="Associated temperature in (ºC)" class="TABLEDATACELL" nowrap="nowrap" align="Left" colspan="1" rowspan="1">Max Temperature (ºC)</td>
<td class="TABLEDATACELLNOTT" nowrap="nowrap" align="Center" colspan="1" rowspan="1">6</td>
<td class="TABLEDATACELLNOTT" nowrap="nowrap" align="Center" colspan="1" rowspan="1"> 13:41:30</td>
</tr>

我现在的表情是:

<tr>[\s]<td[^<]+?>Max Temperature[\w\s]*</td>[\s]
<td[^<]+?>(?<value>([\d]+))</td>[\s]
<td[^<]+?>(?<time>([\d\:]+))</td>[\s]</tr>

但是我似乎无法提取任何匹配项。谁能指出我正确的方向,谢谢。

最佳答案

众所周知,使用正则表达式可靠地解析 HTML 是非常困难的。

我想我会寻找一个 HTML 解析库,或者一个“屏幕抓取”库;)

如果 HTML 来自不可靠的来源,您必须格外小心,以妥善处理恶意 HTML 语法。错误的 HTML 处理是安全攻击的主要来源。

关于c# - 用于 html 解析的正则表达式(在 c# 中),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/271741/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com