- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
RegExp I have constructed到目前为止:
(?(DEFINE)
# URL
(?<proto> (https?:)?\/\/)
(?<port> :[0-9]{2,5})
(?<tld> (?:com|net|info|biz|us|org))
(?<path> (\/([a-z0-9+%-]\.?)+)*\/?)
(?<query> \?[a-z+&$_.-][a-z0-9;:@&%=+\/.-]*)
(?<hash> \#[a-z_.-][a-z0-9+$%_.-]*)
(?<subdomain> ([a-z0-9\-\.]+)\.)
# Exceptions
(?<yt_domain> (www\.)?(youtube\.com|youtu\.be)\/)
(?<yt_hash> ([\w-]{10,12})+)
(?<yt_video> \g<proto>?\g<yt_domain>+(watch)?(\/embed\/|\?v=)+\g<yt_hash>+)
)
# Capture
((?!\g<yt_video>+.*)
(\g<proto>?
\g<subdomain>
\g<tld>
\g<port>?
\g<path>?
\g<query>?
\g<hash>?
))
\g<yt_video>
)没有从匹配列表中排除youtube视频链接。
http:www.google.com/
http//www.google.com/
http://www.google.com/
://www.google.com/
www.google.com/
www.google.com:8000
www.google.com/?key=value
github.io
www.google.com/abc/def/ijk#123
www.google.com/abc/def/ijk?v=123123123
www.google.com/abc/def/watch?v=1231231231
https://www.youtube.com/channel/UCgeu2xe0XRscaKyvBt3WgmQ
http://www.google.com/?key=value
http://www.youtube.com/
http://www.youtube.com/watch?v=B5Gj78s6H7w&feature=youtu.be
https://www.youtube.com/embed/y19EaW2X7ac
music.youtube.com/embed/y19EaW2X7ac
https://www.youtube.com/watch?v=B5Gj78s6H7w&feature=youtu.be
https://www.youtube.com/watch?feature=youtu.be&v=B5Gj78s6H7w
https://www.youtu.be/B5Gj78s6H7w&feature=youtu.be
https://www.youtu.be/B5Gj78s6H7w
最佳答案
经过一番弄乱之后,您诊断非YouTube的方式
功能是将其余部分注释掉,并查看其匹配项。
您必须了解的超前断言是它们告诉
引擎是,在目前的位置上不可能有事。
它所做的只是将位置提高1并重试。
这样做直到到达断言通过的位置。
由于您没有 anchor ,因此它将线的其他部分与之匹配。
因此,您必须跳过这段文本以避免部分内容。
有几种解决方法,但是到目前为止,最简单的方法是匹配它
过去的(*SKIP) (*FAIL)
。
引擎实际上不匹配它,但是它使当前位置刚好超过它
然后再试一次。
我已经摆脱(或转换为集群)不必要的捕获组。
添加跳过/失败,将您的TLD转换为三元树,并格式化为
阅读目的。
获取RegexFormat 8,它可以为您执行此操作并具有
用于正则表达式测试的内置引擎。
还要注意,此(?: [\w-]{10,12} )+
一次的粒度为10到12个字符。其中[\w-]{10,}
将匹配> 10个字符。它在<yt_hash>
函数中。用此(?&yt_hash)+
调用它时,量词是多余的/无用的。
由于它现在成功地跳过了对(?&yt_video) .*
的调用
您必须调查该功能的各个部分,以了解为什么它没有
匹配,因此跳过其他人。
在这里它被压缩
https://regex101.com/r/pOq3Hc/1
/(?i)(?(DEFINE)(?<proto>(?:https?:)?\/\/)(?<port>:[0-9]{2,5})(?<tld>(?:a(?:[cd]|e(?:ro)?|[fgil-oqr]|s(?:ia)?|[tuwxz])|b(?:[abd-h]|iz?|[jl-oq-tvwyz])|c(?:at?|[cdf-ik-n]|o(?:m|op)?|[ru-z])|d[ejkmoz]|e[ceghr-u]|f[i-kmor]|g[abd-il-np-uwy]|h[kmnrtu]|i(?:[delm]|n(?:fo|t)?|[oq-t])|j(?:[em]|o(?:bs)?|p)|k[eg-imnprwyz]|l[a-cikr-vy]|m(?:[ac-hk]|lc?|[mn]|o(?:bi)?|[p-t]|u(?:seum)?|[v-z])|n(?:a(?:me)?|c|et?|[fgilopruz])|o(?:m|rg)|p(?:[ae-hk-n]|ost|ro?|[stwy])|qa|r[eosuw]|s(?:[a-eg-or]|t(?:udio)?|[uvx-z])|t(?:[cd]|el|[f-hj-p]|r(?:avel)?|[tvwz])|u[agkmsyz]|v[aceginu]|w[fs]|y[et]|z[amw]))(?<path>(\/(?:[a-z0-9+%-]\.?)+)*\/?)(?<query>\?[a-z+&$_.-][a-z0-9;:@&%=+\/.-]*)(?<hash>\#[a-z_.-][a-z0-9+$%_.-]*)(?<subdomain>[a-z0-9\-\.]+\.)(?<yt_domain>(?:www\.)?(?:youtube\.com|youtu\.be)\/)(?<yt_hash>(?:[\w-]{10,12})+)(?<yt_video>(?&proto)?(?&yt_domain)+(?:watch)?(?:\/embed\/|\?v=)+(?&yt_hash)+))((?&yt_video).*(*SKIP)(*FAIL)|(?&proto)?(?&subdomain)(?&tld)(?&port)?(?&path)?(?&query)?(?&hash)?)/
(?i)
(?(DEFINE)
# URL
(?<proto> # (1 start)
(?: https?: )?
//
) # (1 end)
(?<port> : [0-9]{2,5} ) # (2)
(?<tld> # (3 start)
(?:
a
(?:
[cd]
| e
(?: ro )?
| [fgil-oqr]
| s
(?: ia )?
| [tuwxz]
)
| b
(?: [abd-h] | iz? | [jl-oq-tvwyz] )
| c
(?:
at?
| [cdf-ik-n]
| o
(?: m | op )?
| [ru-z]
)
| d [ejkmoz]
| e [ceghr-u]
| f [i-kmor]
| g [abd-il-np-uwy]
| h [kmnrtu]
| i
(?:
[delm]
| n
(?: fo | t )?
| [oq-t]
)
| j
(?:
[em]
| o
(?: bs )?
| p
)
| k [eg-imnprwyz]
| l [a-cikr-vy]
| m
(?:
[ac-hk]
| lc?
| [mn]
| o
(?: bi )?
| [p-t]
| u
(?: seum )?
| [v-z]
)
| n
(?:
a
(?: me )?
| c
| et?
| [fgilopruz]
)
| o
(?: m | rg )
| p
(?: [ae-hk-n] | ost | ro? | [stwy] )
| qa
| r [eosuw]
| s
(?:
[a-eg-or]
| t
(?: udio )?
| [uvx-z]
)
| t
(?:
[cd]
| el
| [f-hj-p]
| r
(?: avel )?
| [tvwz]
)
| u [agkmsyz]
| v [aceginu]
| w [fs]
| y [et]
| z [amw]
)
) # (3 end)
(?<path> # (4 start)
( # (5 start)
/
(?: [a-z0-9+%-] \.? )+
)* # (5 end)
/?
) # (4 end)
(?<query> \? [a-z+&$_.-] [a-z0-9;:@&%=+/.-]* ) # (6)
(?<hash> \# [a-z_.-] [a-z0-9+$%_.-]* ) # (7)
(?<subdomain> # (8 start)
[a-z0-9\-\.]+
\.
) # (8 end)
# Exceptions
(?<yt_domain> # (9 start)
(?: www\. )?
(?: youtube\.com | youtu\.be )
/
) # (9 end)
(?<yt_hash> # (10 start)
(?: [\w-]{10,12} )+
) # (10 end)
(?<yt_video> # (11 start)
(?&proto)? (?&yt_domain)+
(?: watch )?
(?: /embed/ | \?v= )+
(?&yt_hash)+
) # (11 end)
)
# Capture
( # (12 start)
(?&yt_video) .*
(*SKIP) (*FAIL)
|
(?&proto)?
(?&subdomain)
(?&tld)
(?&port)?
(?&path)?
(?&query)?
(?&hash)?
) # (12 end)
关于php - 正则表达式:将除YouTube链接之外的所有链接与视频进行匹配,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53506183/
我喜欢 smartcase,也喜欢 * 和 # 搜索命令。但我更希望 * 和 # 搜索命令区分大小写,而/和 ?搜索命令遵循 smartcase 启发式。 是否有隐藏在某个地方我还没有找到的设置?我宁
关闭。这个问题是off-topic .它目前不接受答案。 想改进这个问题? Update the question所以它是on-topic对于堆栈溢出。 10年前关闭。 Improve this qu
从以下网站,我找到了执行java AD身份验证的代码。 http://java2db.com/jndi-ldap-programming/solution-to-sslhandshakeexcepti
似乎 melt 会使用 id 列和堆叠的测量变量 reshape 您的数据框,然后通过转换让您执行聚合。 ddply,从 plyr 包看起来非常相似..你给它一个数据框,几个用于分组的列变量和一个聚合
我的问题是关于 memcached。 Facebook 使用 memcached 作为其结构化数据的缓存,以减少用户的延迟。他们在 Linux 上使用 UDP 优化了 memcached 的性能。 h
在 Camel route ,我正在使用 exec 组件通过 grep 进行 curl ,但使用 ${HOSTNAME} 的 grep 无法正常工作,下面是我的 Camel 路线。请在这方面寻求帮助。
我正在尝试执行相当复杂的查询,在其中我可以排除与特定条件集匹配的项目。这是一个 super 简化的模型来解释我的困境: class Thing(models.Model) user = mod
我正在尝试执行相当复杂的查询,我可以在其中排除符合特定条件集的项目。这里有一个 super 简化的模型来解释我的困境: class Thing(models.Model) user = mod
我发现了很多嵌入/内容项目的旧方法,并且我遵循了在这里找到的最新方法(我假设):https://blog.angular-university.io/angular-ng-content/ 我正在尝试
我正在寻找如何使用 fastify-nextjs 启动 fastify-cli 的建议 我曾尝试将代码简单地添加到建议的位置,但它不起作用。 'use strict' const path = req
我正在尝试将振幅 js 与 React 和 Gatsby 集成。做 gatsby developer 时一切看起来都不错,因为它发生在浏览器中,但是当我尝试 gatsby build 时,我收到以下错
我试图避免过度执行空值检查,但同时我想在需要使代码健壮的时候进行空值检查。但有时我觉得它开始变得如此防御,因为我没有实现 API。然后我避免了一些空检查,但是当我开始单元测试时,它开始总是等待运行时异
尝试进行包含一些 NOT 的 Kibana 搜索,但获得包含 NOT 的结果,因此猜测我的语法不正确: "chocolate" AND "milk" AND NOT "cow" AND NOT "tr
我正在使用开源代码共享包在 iOS 中进行 facebook 集成,但收到错误“FT_Load_Glyph failed: glyph 65535: error 6”。我在另一台 mac 机器上尝试了
我正在尝试估计一个标准的 tobit 模型,该模型被审查为零。 变量是 因变量 : 幸福 自变量 : 城市(芝加哥,纽约), 性别(男,女), 就业(0=失业,1=就业), 工作类型(失业,蓝色,白色
我有一个像这样的项目布局 样本/ 一种/ 源/ 主要的/ java / java 资源/ .jpg 乙/ 源/ 主要的/ java / B.java 资源/ B.jpg 构建.gradle 设置.gr
如何循环遍历数组中的多个属性以及如何使用map函数将数组中的多个属性显示到网页 import React, { Component } from 'react'; import './App.css'
我有一个 JavaScript 函数,它进行 AJAX 调用以返回一些数据,该调用是在选择列表更改事件上触发的。 我尝试了多种方法来在等待时显示加载程序,因为它当前暂停了选择列表,从客户的 Angul
可能以前问过,但找不到。 我正在用以下形式写很多语句: if (bar.getFoo() != null) { this.foo = bar.getFoo(); } 我想到了三元运算符,但我认
我有一个表单,在将其发送到 PHP 之前我正在执行一些验证 JavaScript,验证后的 JavaScript 函数会发布用户在 中输入的文本。页面底部的标签;然而,此消息显示短暂,然后消失...
我是一名优秀的程序员,十分优秀!