- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一个聊天 View ,用户可以在其中互相发送网址。如果是 url,我想让用户按下链接并打开 Web View 。
我正在使用 IFTweetLabel,它使用 RegexKitLite。目前唯一可用的支持是 url 以 http/https 开头。我想支持没有http的链接,例如:www.nytimes.com,甚至没有“www”,nytimes.com。 (以及一堆其他扩展)。
这是 http/s 前缀 reg exp :
@"([hH][tT][tT][pP][sS]?:\\/\\/[^ ,'\">\\]\\)]*[^\\. ,'\">\\]\\)])
有人可以告诉我满足其他要求所需的其他正则表达式吗?
我尝试使用 This一,但是将其添加到 Objective C 代码中会产生很多问题。
谢谢
最佳答案
以下是John Grubers URL Matching Regex :
(?i)\b(?:[a-z][\w-]+:(?:/{1,3}|[a-z0-9%])|www\d{0,3}[.]|[a-z0-9.\-]+[.][a-z]{2,4}/)(?:[^\s()<>]+|\(([^\s()<>]+|(\([^\s()<>]+\)))*\))+(?:\(([^\s()<>]+|(\([^\s()<>]+\)))*\)|[^\s`!()\[\]{};:'".,<>?«»“”‘’])
以下是我通过混合我周围的一些其他正则表达式和大量 Grubers 正则表达式而想出的正则表达式:
(?i)\b(?:(?:[a-z][\w\-]+://(?:\S+?(?::\S+?)?\@)?)|(?:(?:[a-z0-9\-]+\.)+[a-z]{2,4}))(?:[^\s()<>]+|\((?:[^\s()<>]+|(?:\([^\s()<>]*\)))*\))*(?<![\s`!()\[\]{};:'".,<>?«»“”‘’])
以下是一个示例程序,通过 RegexKitLite 演示每个正则表达式与以下示例文本的匹配内容:
Did you see http://www.stackoverflow.com? Or http://www.stackoverflow.com/?
And then there is www.stackoverflow.com/, along with www.stackoverflow.com/index.
Maybe something like stackoverflow.com with extra stackoverflow.com? Or "stackoverflow.com"?
Perhaps jobs.stackoverflow.com, or 'http://twitter.com/#!/CHOCKENBERRY', the CHOCKLOCK!!
File @file:///Users/johne/rkl/rkl.html#RegexKitLiteCookbook?
Maybe http://www.yahoo.com/index///i.html! http://www.yahoo.com/////xyz.html?!
代码:
#import <Foundation/Foundation.h>
#import "RegexKitLite.h"
int main(int argc, char *argv[]) {
NSAutoreleasePool *pool = [[NSAutoreleasePool alloc] init];
NSString *urlRegex = @"(?i)\\b(?:(?:[a-z][\\w\\-]+://(?:\\S+?(?::\\S+?)?\\@)?)|(?:(?:[a-z0-9\\-]+\\.)+[a-z]{2,4}))(?:[^\\s()<>]+|\\((?:[^\\s()<>]+|(?:\\([^\\s()<>]*\\)))*\\))*(?<![\\s`!()\\[\\]{};:'\".,<>?«»“”‘’])";
// John Gruber's URL matching regex from http://daringfireball.net/2010/07/improved_regex_for_matching_urls
NSString *gruberURLRegex = @"(?i)\\b(?:[a-z][\\w-]+:(?:/{1,3}|[a-z0-9%])|www\\d{0,3}[.]|[a-z0-9.\\-]+[.][a-z]{2,4}/)(?:[^\\s()<>]+|\\(([^\\s()<>]+|(\\([^\\s()<>]+\\)))*\\))+(?:\\(([^\\s()<>]+|(\\([^\\s()<>]+\\)))*\\)|[^\\s`!()\\[\\]{};:'\".,<>?«»“”‘’])";
NSString *urlString = @"Did you see http://www.stackoverflow.com? Or http://www.stackoverflow.com/?\n\nAnd then there is www.stackoverflow.com/, along with www.stackoverflow.com/index.\n\nMaybe something like stackoverflow.com with extra stackoverflow.com? Or \"stackoverflow.com\"?\n\nPerhaps jobs.stackoverflow.com, or 'http://twitter.com/#!/CHOCKENBERRY', the CHOCKLOCK!!\n\nFile @file:///Users/johne/rkl/rkl.html#RegexKitLiteCookbook?\n\nMaybe http://www.yahoo.com/index///i.html! http://www.yahoo.com/////xyz.html?!";
NSLog(@"String :\n\n%@\n\n", urlString);
NSLog(@"Matches: %@\n", [urlString componentsMatchedByRegex:urlRegex]);
NSLog(@"Gruber URL Regex Matches: %@\n", [urlString componentsMatchedByRegex:gruberURLRegex]);
[pool release]; pool = NULL;
return(0);
}
编译:
shell% gcc -o url url.m RegexKitLite.m -framework Foundation -licucore
运行时:
shell% ./url
2011-05-27 20:32:58.204 url[25520:903] String :
Did you see http://www.stackoverflow.com? Or http://www.stackoverflow.com/?
And then there is www.stackoverflow.com/, along with www.stackoverflow.com/index.
Maybe something like stackoverflow.com with extra stackoverflow.com? Or "stackoverflow.com"?
Perhaps jobs.stackoverflow.com, or 'http://twitter.com/#!/CHOCKENBERRY', the CHOCKLOCK!!
File @file:///Users/johne/rkl/rkl.html#RegexKitLiteCookbook?
Maybe http://www.yahoo.com/index///i.html! http://www.yahoo.com/////xyz.html?!
2011-05-27 20:32:58.211 url[25520:903] Matches: (
"http://www.stackoverflow.com",
"http://www.stackoverflow.com/",
"www.stackoverflow.com/",
"www.stackoverflow.com/index",
"stackoverflow.com",
"stackoverflow.com",
"stackoverflow.com",
"jobs.stackoverflow.com",
"http://twitter.com/#!/CHOCKENBERRY",
"file:///Users/johne/rkl/rkl.html#RegexKitLiteCookbook",
"http://www.yahoo.com/index///i.html",
"http://www.yahoo.com/////xyz.html"
)
2011-05-27 20:32:58.213 url[25520:903] Gruber URL Regex Matches: (
"http://www.stackoverflow.com",
"http://www.stackoverflow.com/",
"www.stackoverflow.com/",
"www.stackoverflow.com/index",
"http://twitter.com/#!/CHOCKENBERRY",
"file:///Users/johne/rkl/rkl.html#RegexKitLiteCookbook",
"http://www.yahoo.com/index///i.html",
"http://www.yahoo.com/////xyz.html"
)
编辑 2011/05/27: 对正则表达式进行了细微更改,以修复与 (
)
不匹配的问题括号正确。
编辑 2011/05/27: 发现上面的正则表达式不能很好地处理一些额外的极端情况。更新的正则表达式:
(?i)\b(?:[a-z][\w\-]+://(?:\S+?(?::\S+?)?\@)?)?(?:(?:(?<!:/|\.)(?:(?:[a-z0-9\-]+\.)+[a-z]{2,4}(?![a-z]))|(?<=://)/))(?:(?:[^\s()<>]+|\((?:[^\s()<>]+|(?:\([^\s()<>]*\)))*\))*)(?<![\s`!()\[\]{};:'".,<>?«»“”‘’])
...作为 Obj-C 字符串:
@"(?i)\\b(?:[a-z][\\w\\-]+://(?:\\S+?(?::\\S+?)?\\@)?)?(?:(?:(?<!:/|\\.)(?:(?:[a-z0-9\\-]+\\.)+[a-z]{2,4}(?![a-z]))|(?<=://)/))(?:(?:[^\\s()<>]+|\\((?:[^\\s()<>]+|(?:\\([^\\s()<>]*\\)))*\\))*)(?<![\\s`!()\\[\\]{};:'\".,<>?«»“”‘’])";
OP 还询问如何确保尾随 TLD 是“有效的”。这是相同的正则表达式,采用 Obj-C 字符串形式,其中包含所有 currently valid TLDs (截至2011年5月27日):
@"(?i)\\b(?:[a-z][\\w\\-]+://(?:\\S+?(?::\\S+?)?\\@)?)?(?:(?:(?<!:/|\\.)(?:(?:[a-z0-9\\-]+\\.)+(?:(ac|ad|ae|aero|af|ag|ai|al|am|an|ao|aq|ar|arpa|as|asia|at|au|aw|ax|az|ba|bb|bd|be|bf|bg|bh|bi|biz|bj|bm|bn|bo|br|bs|bt|bv|bw|by|bz|ca|cat|cc|cd|cf|cg|ch|ci|ck|cl|cm|cn|co|com|coop|cr|cu|cv|cx|cy|cz|de|dj|dk|dm|do|dz|ec|edu|ee|eg|er|es|et|eu|fi|fj|fk|fm|fo|fr|ga|gb|gd|ge|gf|gg|gh|gi|gl|gm|gn|gov|gp|gq|gr|gs|gt|gu|gw|gy|hk|hm|hn|hr|ht|hu|id|ie|il|im|in|info|int|io|iq|ir|is|it|je|jm|jo|jobs|jp|ke|kg|kh|ki|km|kn|kp|kr|kw|ky|kz|la|lb|lc|li|lk|lr|ls|lt|lu|lv|ly|ma|mc|md|me|mg|mh|mil|mk|ml|mm|mn|mo|mobi|mp|mq|mr|ms|mt|mu|museum|mv|mw|mx|my|mz|na|name|nc|ne|net|nf|ng|ni|nl|no|np|nr|nu|nz|om|org|pa|pe|pf|pg|ph|pk|pl|pm|pn|pr|pro|ps|pt|pw|py|qa|re|ro|rs|ru|rw|sa|sb|sc|sd|se|sg|sh|si|sj|sk|sl|sm|sn|so|sr|st|su|sv|sy|sz|tc|td|tel|tf|tg|th|tj|tk|tl|tm|tn|to|tp|tr|travel|tt|tv|tw|tz|ua|ug|uk|us|uy|uz|va|vc|ve|vg|vi|vn|vu|wf|ws|xn--0zwm56d|xn--11b5bs3a9aj6g|xn--3e0b707e|xn--45brj9c|xn--80akhbyknj4f|xn--90a3ac|xn--9t4b11yi5a|xn--clchc0ea0b2g2a9gcd|xn--deba0ad|xn--fiqs8s|xn--fiqz9s|xn--fpcrj9c3d|xn--fzc2c9e2c|xn--g6w251d|xn--gecrj9c|xn--h2brj9c|xn--hgbk6aj7f53bba|xn--hlcj6aya9esc7a|xn--j6w193g|xn--jxalpdlp|xn--kgbechtv|xn--kprw13d|xn--kpry57d|xn--lgbbat1ad8j|xn--mgbaam7a8h|xn--mgbayh7gpa|xn--mgbbh1a71e|xn--mgbc0a9azcg|xn--mgberp4a5d4ar|xn--o3cw4h|xn--ogbpf8fl|xn--p1ai|xn--pgbs0dh|xn--s9brj9c|xn--wgbh1c|xn--wgbl6a|xn--xkc2al3hye2a|xn--xkc2dl3a5ee0h|xn--yfro4i67o|xn--ygbi2ammx|xn--zckzah|xxx|ye|yt|za|zm|zw))(?![a-z]))|(?<=://)/))(?:(?:[^\\s()<>]+|\\((?:[^\\s()<>]+|(?:\\([^\\s()<>]*\\)))*\\))*)(?<![\\s`!()\\[\\]{};:'\".,<>?«»“”‘’])";
关于iPhone - URL 有效性的 Reg Exp,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6137865/
这个问题已经有答案了: What is the best way to set a register to zero in x86 assembly: xor, mov or and? (1 个回答)
中有3个事件fns重装 ,我可以对两者做同样的事情 reg-event-db和 reg-event-fx . reg-event-db之间的主要区别是什么, reg-event-fx和 reg-eve
我将 Verilog 与 modelSim 一起使用,当我尝试将 reg 变量分配给另一个 reg 变量的不同部分时出现以下错误: ** Error: Range width must be grea
我在Oracle Forms中要求编写一个PLSQL块,该块将通过包含逗号分隔记录的游标从数据库中读取数据。我已经完成了逻辑,但想检查一下我开发的这个逻辑是否可以以任何方式改进。。因此,我使用subs
使用以下代码是否存在执行速度差异: cmp al, 0 je done 以及以下内容: or al, al jz done 我知道JE和JZ指令是相同的,并且使用OR可以使字节大小提高1个字节。但是,
我正在维护和扩展诊断测试套件的功能,这段代码多次出现,但我不确定它的作用: int ret = 0, i, *reg; int size = sizeof(Regs)/sizof(Reg); for(
在一般情况下,可以使用内存或寄存器操作数的指令如何使用内存操作数变慢然后 mov + mov -> 指令 -> mov + mov 基于在 Agner Fog's instruction tables
假设module_a里面有register_a,它需要链接到module_b。 register_a 是否应该单独声明并分配给 module_a 的输出: reg register_a; assign
这是 ls -R 命令的输出: .: compare.sh searchByFile.sh startup.sh temp.txt test.sh compare.sh~ search
众所周知,WaveFront (AMD OpenCL) 与 WARP (CUDA) 非常相似:http://research.cs.wisc.edu/multifacet/papers/isca14-
我想将一张图片与其他图片列表一张一张地进行比较,然后我想知道哪张图片的相似度更高。 我试图用 Python OPENCV facerec_demo.py 做同样的事情,但它给出了错误: Attribu
打开光驱硬盘的自动运行特性 REG 复制代码 代码如下: Windows Registry Editor Version 5.00</p>
代码如下: Windows Registry Editor Version 5.00</p> <p>[HKEY_CURRENT_USER\Software\Microso
代码如下: Windows Registry Editor Version 5.00</p> <p>[HKEY_LOCAL_MACHINE\SYSTEM\ControlS
代码如下: Windows Registry Editor Version 5.00 [HKEY_CLASSES_ROOT\exefile] @="应用程序&q
我知道在 REG 文件的行首放一个分号表示它已被注释。我想知道是否可以在一行(一行的右侧)后添加注释? 最佳答案 在同一行的注释前加上分号就足够了。换句话说,reg 文件在带有注册表项的一行以及整行注
我在 Verilog 中有这个架构/拓扑: 如何访问内部注册 IntReg ,这不是 IntModule 中的输入/输出,在 SystemVerilog 中? always @(posedge clk
我正在尝试使用字节流读取包含普通文本数据的文件。而且我知道在字节流中,每个字节都将被一个一个地读取。因此,如果我通过字节流读取文本文件中的数据 Hi How are you!!!!! 那么它应该给我每
我有一个运行 IIS/Asp.net 的网站的登录表单,在预订期间因为非常缓慢。 在登录页面我正在做的: $("#submit1").trigger('click') //this will logi
这个问题在这里已经有了答案: 关闭10 年前。 Possible Duplicate: non-static variable cannot be referenced from a static
我是一名优秀的程序员,十分优秀!