- Java 双重比较
- java - 比较器与 Apache BeanComparator
- Objective-C 完成 block 导致额外的方法调用?
- database - RESTful URI 是否应该公开数据库主键?
我正在尝试使用 Regex 在 Java8 中解析 traceroute 结果。
我正在使用以下正则表达式来识别组。
^(\\d*).*[AS(\\d*)]?\\s+([\\w+\\.]+)\\s+\\(([\\d+\\.]+)\\)[\\s+(\\d+\\.\\d+)\\s+ms]+
我需要解析的一些示例行是:
1 10.33.128.1 (10.33.128.1) 4.452 ms 3.459 ms 3.474 ms
6 * [AS3356] 4.68.72.218 (4.68.72.218) 12.432 ms 11.819 ms
* 4.68.72.218 (4.68.72.218) 12.432 ms 11.819 ms
61.182.180.62 (61.182.180.62) 175.300 ms 203.001 ms
我想提取跳数(如果可用)、ASN(如果可用)、主机名、IP 和时间
但使用上面的正则表达式,它匹配字符串 1、2 和 4,这是我想要的,但只给我跃点、主机和 ASN。
我的代码是这样的:
Pattern hop_pattern = Pattern.compile(
"^(\\d*).*[AS(\\d*)]?\\s+([\\w+\\.]+)\\s+\\(([\\d+\\.]+)\\)[\\s+(\\d+\\.\\d+)\\s+ms]+")
Matcher m = hop_pattern.matcher(target);
while(m.find()) {
System.out.println("count: " + m.groupCount());
for(int i = 1; i < m.groupCount() + 1; i++) {
System.out.println(i + "->" + m.group(i));
}
}
我需要解析的一些示例行是:
1 10.33.128.1 (10.33.128.1) 4.452 ms 3.459 ms 3.474 ms
6 * [AS3356] 4.68.72.218 (4.68.72.218) 12.432 ms 11.819 ms
* 4.68.72.218 (4.68.72.218) 12.432 ms 11.819 ms
61.182.180.62 (61.182.180.62) 175.300 ms 203.001 ms
我想提取跳数(如果可用)、ASN(如果可用)、主机名、IP 和时间
但使用上面的正则表达式,它匹配字符串 1、2 和 4,这是我想要的,但只给我跃点、主机和 ASN。
我的代码是这样的:
Pattern hop_pattern = Pattern.compile(
"^(\\d*).*[AS(\\d*)]?\\s+([\\w+\\.]+)\\s+\\(([\\d+\\.]+)\\)[\\s+(\\d+\\.\\d+)\\s+ms]+")
Matcher m = hop_pattern.matcher(target);
while(m.find()) {
System.out.println("count: " + m.groupCount());
for(int i = 1; i < m.groupCount() + 1; i++) {
System.out.println(i + "->" + m.group(i));
}
}
我不确定代码或正则表达式本身是否有问题。感谢您的帮助!
更新:一些示例和样本输出
1 [AS0] 10.200.200.200 (10.200.200.200) 37.526 ms 35.793 ms 37.728 ms
Expected Output: hop: 1 asn: 0 hostname: 10.200.200.200 ip: 10.200.200.200 time: [37.526, 35.793, 37.728]2 [AS0] scsc-usr-13500-02-eth1-07.xyz.com (10.96.15.3) 37.927 ms 36.122 ms *
Expected Output: hop: 2 asn: 0 hostname: scsc-usr-13500-02-eth1-07.xyz.com ip: 10.96.15.3 time: [37.927, 36.122]
我不确定代码或正则表达式本身是否有问题。感谢您的帮助!
最佳答案
为了捕获您要查找的所有内容,您需要使用两个单独的正则表达式。这样做的原因是正则表达式只会捕获它找到的与条件匹配的 last 组,并且您的跟踪路由结果中有多个时间(例如 4.452 ms
、 3.459 ms
, 和 3.474 ms
在你的第一行)。
为了了解捕获了哪些组,您可以使用以下正则表达式(它是 PCRE,在 Java 中不起作用,但它可以清楚地指示捕获了哪个组)。
This code can be seen in use here
^(?P<hop>\d+)?[\h*]*(?:\[AS(?<ASN>\d*)\])?\h+(?<hostname>[\w\.]+)\h+\((?<ip>[\d+\.]+)\)\h+(?<times>.*?)\h*$
稍微修改一下,上面的正则表达式就可以在 Java 中使用(据我所知,Java 正则表达式不支持水平空格 \h
和命名捕获组 (?<name>...)
)。
This code can be seen in use here
^(\d+)?[\ \t*]*(?:\[AS(\d*)\])?[\ \t]+([\w\.]+)[\ \t]+\(([\d+\.]+)\)[\ \t]+(.*?)[\ \t]*$
注意:都是全局的g
和多行 m
使用修饰符。
对您在第 1 部分 中捕获的时间 运行第二个正则表达式以收集所有时间的列表。
This code can be seen in user here
([\d.]+)
1 10.33.128.1 (10.33.128.1) 4.452 ms 3.459 ms 3.474 ms
6 * [AS3356] 4.68.72.218 (4.68.72.218) 12.432 ms 11.819 ms
* 4.68.72.218 (4.68.72.218) 12.432 ms 11.819 ms
61.182.180.62 (61.182.180.62) 175.300 ms 203.001 ms
匹配 1
1 10.33.128.1 (10.33.128.1) 4.452 ms 3.459 ms 3.474 ms
1
10.33.128.1
10.33.128.1
4.452 ms 3.459 ms 3.474 ms
匹配 2
6 * [AS3356] 4.68.72.218 (4.68.72.218) 12.432 ms 11.819 ms
6
3356
4.68.72.218
4.68.72.218
12.432 ms 11.819 ms
匹配 3
* 4.68.72.218 (4.68.72.218) 12.432 ms 11.819 ms
4.68.72.218
4.68.72.218
12.432 ms 11.819 ms
第 4 场比赛
61.182.180.62 (61.182.180.62) 175.300 ms 203.001 ms
61.182.180.62
61.182.180.62
175.300 ms 203.001 ms
4.452 ms 3.459 ms 3.474 ms
匹配 1
4.452
4.452
匹配 2
3.459
3.459
匹配 3
3.474
3.474
感谢Casimir et Hippolyte指出 Java 确实像其他正则表达式风格一样允许命名捕获组。
这是一个更新的正则表达式,因为 Java 确实支持命名的捕获组 (?<name>...)
This regex can be seen in use here
^(?P<hop>\d+)?[\t *]*(?:\[AS(?<ASN>\d*)\])?[\t ]+(?<hostname>[\w\.]+)[\t ]+\((?<ip>[\d+\.]+)\)[\t ]+(?<times>.*?)[\t ]*$
关于java - 使用 Java8 捕获 traceroute 中的组的正则表达式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46224504/
关闭。这个问题是off-topic .它目前不接受答案。 想改善这个问题吗? Update the question所以它是 on-topic对于堆栈溢出。 8年前关闭。 Improve this q
所以我对此有些疑惑。所有这些都在一个更大的公司网络中,但所有机器基本上都在现场。 我们有一台机器 (linux) 向另一台机器 (windows) 发送 SOAP 请求,几天后这些请求在一定时间后失败
关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。 想改善这个问题吗?更新问题,使其成为 on-topic对于堆栈溢出。 6年前关闭。 Improve thi
tracert 返回请求的超时。我从中了解到的是数据包在网络上的某些地方丢失了。 这是否意味着问题出在 ISP 或托管服务提供商或我的 Windows 系统上? 10 * *
我正在尝试在 Python 2.6 中实现 UDP traceroute 解决方案,但我无法理解为什么我需要 root 权限来执行与我的操作系统附带的 traceroute 实用程序相同的操作。 这段
下面的示例输出是由traceroute转储的,我想使用pcre表达式来提取一些数据。 host-1 (1.1.1.1) 10.111 ms 20.222 ms host-2 (2.2.2.2)
Traceroute 是一个跟踪从 A 到 B 的路径的应用程序。(A 是您的位置,B 是您要跟踪的服务器)。 基本算法如下: send UDP with TTL = 1 Server A1 rece
在使用或者挑选VPS的过程中,我们常常会说到线路问题,去程的话好处理,直接在本地或者其他目标地点tracert服务器IP就可以,如果在服务器上测试回程路由的话,我们可能用到这个工具:tracero
我正在尝试获取 traceroute 失败时返回的错误消息。例如: from subprocess import CalledProcessError, check_output try: o
我想通过我的应用程序运行 traceroute 命令。 我该怎么做? Runtime.getRuntime().exec("traceroute google.com") 不工作。 java.io.I
为了完成我的硕士论文,我正在开发一种工具来测试和评估多路径网络的公式。 我将使用 traceroute 工具通过向它传递 -s 标志、源 IP 和目标 IP 来跟踪两个多宿主主机之间的网络。我有多个源
我试图找出使用 Traceroute 到达 google.com 需要多少跳。 Traceroute 的输出始终相同。我的命令:traceroute google.com输出: traceroute
假设我们对www.google.com进行traceroute,那么参数“max hops”将默认设置为30,因为我们没有指定它。 现在假设在找到 www.google.com 之前,tracerou
显然,ICMP 并不是创建 Traceroute 的唯一方法。 This和 this answer 表示可以发送低 TTL 的 UDP 数据包(或任何其他数据包)并等待 ICMP 消息。 我将如何在
我有一个用于 Unix 系统的 traceroute Python 程序,它打印出数据包从本地机器到达目的地所采用的路径——即数据包经过的路由器序列。问题是我得到的输出显示: traceroute t
关闭。这个问题是off-topic .它目前不接受答案。 想改进这个问题吗? Update the question所以它是on-topic用于堆栈溢出。 关闭 10 年前。 Improve thi
好的,所以我尝试使用讲师提供的 Material 编写一个简单的 ICMP traceroute,这些 Material 是 echo_request 和 icmp_receive 程序,我想将它们合
根据 Wikipedia , 一个跟踪程序 Traceroute, by default, sends a sequence of User Datagram Protocol (UDP) packe
我正在尝试根据 traceroute 是否从特定 IP 地址获得响应来执行代码。所以: if traceroute 123.456.78.9 then option 1 else opti
这是我第一次提出任何问题,请原谅我的任何错误。 我想实现 traceroute 功能,就像 android play 商店中提供的这个应用程序一样。 Visual TracertPro Tracero
我是一名优秀的程序员,十分优秀!