gpt4 book ai didi

html - 用于匹配主题标签的正则表达式模式,但不在 HTML 属性中

转载 作者:太空宇宙 更新时间:2023-11-04 16:06:15 26 4
gpt4 key购买 nike

我正在尝试使用正则表达式 #([a-z0-9_]+)提取 HTML 文本中的主题标签,但在 HTML 属性中遇到问题.

例如在 HTML 文本中:

hola que tal with #hash1.
hola que tal with #hash2

y <a href="hola.que.tal#hash3"> para #hash4. </a>

我想恢复“hash1”、“hash2”和“hash4”,但不是“hash3”。

我尝试通过环视来解决它,表达式如下:

(?<!<)#([a-z0-9_]+)(?!.*?>)

但没有成功。

如何使用单个正则表达式做到这一点?

最佳答案

这应该可行

/#[a-z0-9_]+(?![^<]*>)/

参见 http://www.regexpal.com/?fam=95144

负前瞻的作用是确保存在 <在主题标签和下一个 > 之间.

关于html - 用于匹配主题标签的正则表达式模式,但不在 HTML 属性中,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37920638/

26 4 0