- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
对于我正在开发的应用程序,我需要一个 Perl 脚本来遍历大量 CSV 文件并确保每一行都包含一个有效的 URI。我之前已经问过一个关于解析 CSV 文件的问题,并且我已经开始使用 Text::CSV
让我的生活变得更轻松。现在我遇到了确保 URI 有效的问题。
由于我的应用程序的性质,URI 不需要采用完整形式
protocol://username:password@domain.extension/request?vars=values
我只对请求部分感兴趣。对于一般网站,可以是 .com
、.edu
等之后的任何内容。
我目前有以下 Perl 脚本:
if($_ !~ /^(?:[a-z0-9-._~!$&'()*+,;=:/?@]|%[0-9A-F]{2})*$/i){
print "Invalid URL format";
exit;
} else {
/* stuff */
}
正则表达式应该相当简单。允许请求包含一小组符号中的一个 ([a-z0-9-._~!$&'()*+,;=:/?@]
) 或它可能包含一个百分号 (%
),后跟两个十六进制数字。这些模式中的任何一个都可以无限期地重复。
当我运行此脚本时,出现以下错误:
Number found where operator expected at ./301rules.pl line 58, near "%[0"
(Missing operator before 0?)
Bareword found where operator expected at ./301rules.pl line 58, near "9A"
(Missing operator before A?)
Bareword found where operator expected at ./301rules.pl line 58, near "$/i"
(Missing operator before i?)
syntax error at ./301rules.pl line 58, near "%[0"
很明显,我的正则表达式中的某些内容需要转义,但我不确定是什么。我尝试转义每个 可能的符号以创建以下正则表达式:
if($_ !~ /^(?:[a-z0-9\-\.\_\~\!\$\&\'\(\)\*\+\,\;\=\:\/\?\@]|%[0-9A-F]{2})*$/i){
然而,当我这样做时,它只允许每个 字符串通过测试,即使是我知道无效的字符串,例如 te%st
或 é
那么有没有人有使用 Perl 正则表达式的经验并且知道我需要转义什么以及不应该转义什么?有 19 种不同的符号,我不想尝试所有 2^19 = 524288 种可能性。
编辑 - 投票结束。我发现这个问题实际上就存在于这个循环之上,尽管我还不完全明白为什么。
我有:
if( $_ == "" ){
next;
}
/* regex conditional from above */
无论出于何种原因,尽管 $_
中显然存储了数据,但它一直评估为 true 并进入下一次迭代。我会弄清楚这是为什么,但现在正则表达式可以正常处理所有转义的内容。
最佳答案
在 URI
module 的文档中我发现了以下内容:
PARSING URIs WITH REGEXP
As an alternative to this module, the following (official) regular expression can be used to decode a URI:
my($scheme, $authority, $path,
$query, $fragment) = $uri =~
m|(?:([^:/?#]+):)?(?://([^/?#]*))?([^?#]*)(?:\?([^#]*))?(?:#(.*))?|;The URI::Split module provides the function uri_split() as a readable alternative.
但我认为Regexp::Common::URI可能是 HTTP URI 语法验证的理想解决方案。
use Regexp::Common qw /URI/;
while (<>) {
/$RE{URI}{HTTP}/ and print "Contains an HTTP URI.\n";
}
任何由 Damian 编写并由 Abigail 维护的东西都必须是灵感、伟大、疯狂或以上所有。 (我的意思是怀着最高的敬意)。
关于regex - 使用 Perl 正则表达式确定 URI 是否有效,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6449015/
使用 ruby 1.9.2-p290。我在尝试解析如下 URI 时遇到问题: require 'uri' my_uri = "http://www.anyserver.com/getdata?anyp
根据 http://tools.ietf.org/html/rfc3986和 http://en.wikipedia.org/wiki/Uniform_resource_identifier , UR
如何在文本 block 中发现 URI? 这个想法是将这样的文本运行变成链接。如果只考虑 http(s) 和 ftp(s) 方案,这很容易做到;但是,我猜测一般问题(考虑 tel、mailto 和其他
我的一些网址上有一些特殊字符。例如: http://blabla.com/title/?t=burası 当我从其他页面提供指向该页面的链接时,我使用: URI.encode(s) 产生这个链接: /
我在 Windows Mobile 上使用紧凑型框架/C#。 在我的应用程序中,我通过序列化对象并使用 HttpWebRequest/POST 请求向上发送信息来将数据上传到服务器。在服务器上,发布数
我正在做一个实验,我发现将 Canvas 转换为 blob,然后转换为数据 URI 会导致与直接从 Canvas 获取数据 URI 不同的 URI。打开时的内容在两个 URI 上几乎相同。 使用 bl
我正在尝试在 Rails 3 中实现 OAuth 提供程序。当我尝试授权客户端应用程序时,出现此错误。我正在使用 RESTful auth 插件和 pelles OAuth 插件。当我通过 Rails
我有一个编码的 UI 测试方法: public void MyTestMethod() { string baseUrl = "www.google.com"; GlobalVaria
我知道这是一个常见的错误,我正在使用一个已知的解决方案,但它仍然给我同样的错误: require 'open-uri' url = "http://website.com/dirs/filex[a]"
我正在尝试使用 .NET 中的 HttpClient 来使用 Web 服务,并且在我完成了 msdn 中提到的所有步骤之后 o 出现以下异常:提供了无效的请求 URI。请求 URI 必须是绝对 URI
我正在尝试检索文件的 URI。该文件存储在: /storage/emulated/0/AppName/FileName.png 如果我使用 Uri.fromFile(file),我得到的是 file:
我想知道 (SIP) URI 中的不同参数分隔符表示什么? 部分以;分隔,例如: . 其他用?隔开和 & ,例如: 最佳答案 SIP 分隔符规则来自RFC 2396 RFC 3986 已弃用.但是在
我想调用decodeUrl(...),我这样做是: import "dart:uri"; main() { decodeUrl("str"); } 但是现在有了最新的Dart-SDK,它会报告
在 URI 中,空格可以编码为 + .既然如此,那么在创建具有国际前缀的 tel URI 时是否应该对前导加号进行编码? 哪个更好?两者在实践中都有效吗? Call me Call me 最佳答案 不
我试图弄清楚电子邮件地址的格式是否可以说符合 URI 的定义,但到目前为止我还没有找到明确的确认。我希望有人可以在这里为我提供一些见解。预先感谢:) 最佳答案 是的,但带有“mailto:”前缀。 U
因此,我尝试将 ID 参数附加到 URI 的末尾,当用户单击我的列表中的项目时,用户将被发送到该 URI。我的代码如下: public void onItemClick(AdapterView par
这是 Converting file path to URI 的后续问题. 考虑: require 'uri' uri = URI.join('file:///', '/home/user/dir1/
我在 pl/sql 中创建了一个名为 tester 的包。但我收到以下消息。 绝对URI中的相对路径:java.net.URI.checkPath(URI.java:1823) --Package D
我在 gitlab 上有一个 git repo,使用私有(private) pod 和其他公共(public) pod,下面是我的 Podfile source 'git@gitlab.mycompa
我正在尝试将我的 Rails 应用程序推送到 heroku 上,我正在使用 heroku RedisToGo 附加组件我经历过这个tutorial并完成了那里提到的所有步骤。 但是在推送 heroku
我是一名优秀的程序员,十分优秀!