gpt4 book ai didi

regex - 从与 Perl 中的正则表达式匹配的较大字符串中获取子字符串?

转载 作者:行者123 更新时间:2023-12-03 07:56:24 24 4
gpt4 key购买 nike

我正在编写一个程序,旨在读取 Web 服务器事件的大型日志文件。我的目的是使用一些不同的正则表达式来抓取日志每行的特定位并将它们放入哈希中,以跟踪每个 IP、浏览器类型等出现的次数。给我带来麻烦的部分是从每行中取出与正则表达式匹配的特定文本,以便我可以单独分析它。我目前拥有的是:

my @regexes = (qr/^\S*/);
# Iterate through each line of the data with each regex
foreach my $regex (@regexes) {
# Create an empty hash for all the data
my %dataHash;
foreach my $line (@data) {
# Up to this point I have verified that $line contains the correct line I want to take a "substring" of.
my ($relevantData) = ($line =~ $regex);
#print("$relevantData\n");

打印 $relevantData 当然不是这里的最终目标,但它是为了验证我是否正确获得了我需要的东西。我认为这不相关,但 @data 数组只是前面提到的每行日志分割的数组。

当我激活此打印语句时,它只会一遍又一遍地打印“1”。目前,我使用的正则表达式只是从每行的开头开始直到第一个空格实例,所以我期待的是第一个单词。我尝试过调整括号的位置,我所得到的似乎与我在网上找到的示例相匹配,但我可能会误解它们。从技术上讲,这是一次重新发布,因为它与 this 重复。 ,但我在发布之前使用了这篇文章,这是我复制的,但它似乎不起作用,所以我不确定我做错了什么。预先感谢您!

最佳答案

作为一般建议,如果 Perl 表达式在不应该返回 1 的地方返回 1,那么您很可能正在处理 bool 值( 1 为 true)或计数(分别是自 0 为假)。

这是因为正则表达式经常用于条件子句,例如 if(/regex/)

学习 Perl 正则表达式的一个很好的起点是 https://perldoc.perl.org/perlrequick

您可以在 perlrequick#Extracting-matches 找到这个简洁的示例。

In list context, a match /regex/ with groupings will return thelist of matched values ($1,$2,...). So we could rewrite it as

($hours, $minutes, $second) = ($time =~ /(\d\d):(\d\d):(\d\d)/);

并且您的 qr/^\S*/ 没有 (groupings),这就是为什么您的 $relevantData 仅返回 1 表示“匹配为真”。

(您尚未显示任何示例输入,因此我无法进一步发表评论)

关于regex - 从与 Perl 中的正则表达式匹配的较大字符串中获取子字符串?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/75969144/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com