gpt4 book ai didi

html - 如何修改正则表达式以删除所有后跟 CR 或 LF 的字符串

转载 作者:行者123 更新时间:2023-11-28 00:50:41 25 4
gpt4 key购买 nike

我想从 Hot Bird 13.0E 卫星转发器的一列频率中获取 html
链接在这里:http://pl.kingofsat.net/pos-13E.php

这个保存的html页面很大,有几千行,很难以模式呈现。更简单的方法是从中提取简短内容。


这是演示链接:
https://regex101.com/r/9k9NGA/2

在 Notepad++ 中

- Ctrl+H
- 查找内容:.*(\d{5}\.\d{2}).* 定义的频率
*-替换为:$1
*- 勾选环绕
*- 检查正则表达式
*- 全部替换

部分代码如下:

"basc_tp('m0')"><span class="nbc">11</span><a class="bld">Hot Bird 13C</a></td> <td width="7%" class="bld">bbhg
10719.25</td><td width="2%" class="bld">V</td><td class="w3-hide-small" width="3%"><a class="bld"<td class="pos" dir="ltr">13.0&deg;E</td> <td width="20%"><img src="/action_collapse.gif" id="im1" style="cursor: pointer" onclick="basc_tp('m1')"><span class="nbc">3</span><a class="bld">Hot Bird 13B</a></td> <td width="7%" class="bld">
10727.00</td><td width="2%" class="bld">H</td><td class="w3-hide-small" width="3%"><a class="bld" href="tp.php?tp=225">111</a></td><td class="w3-hide-small" width="10%"><a class="bld" href="pos" dir="ltr">13.0&deg;E</td> <td width="20%"><img src="/action_collapse.gif" id="im2" style="cursor: pointer" onclick="basc_tp('m2')"><span class="nbc">30</span><a class="bld">Hot Bird 13C</a></td> <td width="7%" class="bld">
10758.00</td><td width="2%" class="bld">V</td><td class="w3-hide-small" width="3%"><a class="bld" href="tp.php?tp=5059">112</a></td><td class="w3-hide-small" width="10%"><a class="bld" href=="cursor: pointer" onclick="basc_tp('m3')"><span class="nbc">19</span><a class="bld">Hot Bird 13C</a></td> <td width="7%" class="bld">
10775.00</td><td width="2%" class="bld">H</td><td class="w3-hide-small" width="3%"><a class="bld" href="tp.php?tp=227">113</a></td><td class="w3-hide-small" width="10%"><a class="bld" href=></table><div class="frqb"></div></div> <table class="frq"><tr bgcolor="#D2D2D2"> <td class="pos" dir="ltr">13.0&deg;E</td> <td width="20%"><img src="/action_collapse.gif" id="im10" style="cursor: pointer" onclick="basc_tp('m10')"><span class="nbc">16</span><a class="bld">Hot Bird 13C</a></td> <td width="7%" class="bld">
10911.00</td><td width="2%" class="bld">V</td><td class="w3-hide-small" width="3%"><a class="bld"

以下是部分代码:

"basc_tp('m0')"><span class="nbc">11</span><a class="bld">Hot Bird 13C</a></td> <td width="7%" class="bld">bbhg
10719.25
10727.00
10758.00
10775.00
10911.00

在表达式的顺序中应该添加或更改什么:
.*(\d{5}\.\d{2}).* 它还将包含空白字符(后视)(CR 和 LF)以进行进一步的操作。当代码中出现“.*”后面的字符LF或CR时,出现LF或CR时不包括前面的所有字符和标记,并且前2行没有删除,为什么?

最佳答案

您可以使用一步法获取您的值(value)观列表:

(\d{5}\.\d{2})|(?s:.)

替换为

(?1$1\n:)

正则表达式模式匹配并捕获到第 1 组的五位数字、点和两位数字,或者只匹配任何字符。替换模式是一个条件,如果第 1 组匹配,则用第 1 组和换行符替换找到的匹配项,或者用空字符串(如果匹配任何其他字符)。请注意,如果您选择 . matches newline 选项,则 (?:) 可能会被删除。

关于html - 如何修改正则表达式以删除所有后跟 CR 或 LF 的字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47598330/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com