gpt4 book ai didi

java - 提取字符串——如果不是正则表达式,那又是什么?

转载 作者:行者123 更新时间:2023-11-29 09:30:55 25 4
gpt4 key购买 nike

<分区>

Possible Duplicate:
RegEx match open tags except XHTML self-contained tags

我有一个包含大约 2000 行的文件,例如:

<nobr>&nbsp;&nbsp;&nbsp;&nbsp;<a href="../Carbon_Monoxide_Poisoning_Prevention.htm"><b>poisoning - prevention</b></a></nobr><br>
<nobr>&nbsp;&nbsp;&nbsp;&nbsp;<a href="../Carbon_Monoxide_Symptoms.htm"><b>symptoms</b></a></nobr><br>

1.) URL 始终采用 ../foo.html 的形式

2.) 显示名称有时包含在 <b> ... </b> 中标签,有时不是。

3.) 文件中的每一行最多包含四个 &nbsp;我需要计算并标记为空格。这些最终将用于格式化缩进,所以我需要以某种方式捕获信息。

我需要在带分隔符的平面文件中包含超链接、显示名称和空格数名称,如下所示(基于上述数据):

../Carbon_Monoxide_Poisoning_Prevention.htm,poisoning - prevention,4
../Carbon_Monoxide_Symptoms.htm,symptoms,4

.虽然我可以通过一大堆字符串、子字符串和 if 语句来解析它,但这似乎比它需要的更麻烦。我正在研究 Regex(我第一次这样做),但对某些语法有点不清楚;我学习最好的方法是查看与我的应用程序类似的代码示例,但无法找到任何非常适合的示例。

如有任何帮助,我们将不胜感激!

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com