gpt4 book ai didi

java - 使用正则表达式识别存在的 html 标签

转载 作者:行者123 更新时间:2023-11-30 05:03:35 26 4
gpt4 key购买 nike

我在 Android 上执行此操作,我不想使用任何 html 解析器(库),因为唯一的目的是了解除

之外还存在哪些 html 标签

我正在使用:

Pattern p = Pattern.compile("<^bip/>");

这可以很好地返回除 B、I、P 之外的所有标签,但它也会删除 标签。有人可以修改它以不忽略 img 标签吗?

最佳答案

我认为你的正则表达式定义应该是这样的:

Pattern p = Pattern.compile("(?i)<(?![bip]\\b).*?/?>");
  • ?!对于负面展望//即 <后面不跟( bip )+ 字边界
  • (?i)用于忽略大小写比较
  • .*?用于在打开标签后选择性地抓取 0 个或多个字符
  • /?用于使 > 之前的尾部斜杠可选

关于java - 使用正则表达式识别存在的 html 标签,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5853153/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com