gpt4 book ai didi

javascript 正则表达式否定检测 URL 不包含给定域

转载 作者:行者123 更新时间:2023-12-03 06:58:26 25 4
gpt4 key购买 nike

我需要检查一些html文件并提取未引用2个网站的url

经过多次测试,我得到了这个

/(http|https)?:?(\/\/)\w*\.*\-*[^(mysite.com)]\w*\.?\S*/igm

效果还不错..但并不完美:

例如,可以看到 HERE on regexr.com 它匹配

// End

但不是

www.demo.com

虽然应该是国家,但在 (\/\/) 之后添加 ? 就变成了一个无用的“catch all”

并且如果 url 在开头和结尾处都有 ",而且这种情况显然经常发生不抓取开始 " (正确),但抓取结束一个(错误)

最后它不应该也匹配 theothermysite.net 但很好地理解如何使用否定来处理 OR :-(

请问可以帮忙吗?

最佳答案

喜欢this

/((http|https):(\/\/)|www\.)\w*\.*\-*[^(mysite.com)(theothermysite.net)]\w*\.?[^\s\t\r\n\"]*/igm

我刚刚添加了一个“或www”,替换为\S及其组件加上 \"并在否定中添加另一个原子组,就像您已经对 mysite.com 所做的那样

关于javascript 正则表达式否定检测 URL 不包含给定域,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37166480/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com