gpt4 book ai didi

java - 如何创建正则表达式匹配流?

转载 作者:IT老高 更新时间:2023-10-28 20:34:19 25 4
gpt4 key购买 nike

我正在尝试解析标准输入并提取与特定模式匹配的每个字符串,计算每个匹配项的出现次数,并按字母顺序打印结果。这个问题似乎很适合 Streams API,但我找不到从 Matcher 创建匹配流的简洁方法。

我通过在匹配项上实现迭代器并将其包装到 Stream 中解决了这个问题,但结果不是很可读。如何在不引入其他类的情况下创建正则表达式匹配流?

public class PatternCounter
{
static private class MatcherIterator implements Iterator<String> {
private final Matcher matcher;
public MatcherIterator(Matcher matcher) {
this.matcher = matcher;
}
public boolean hasNext() {
return matcher.find();
}
public String next() {
return matcher.group(0);
}
}

static public void main(String[] args) throws Throwable {
Pattern pattern = Pattern.compile("[a-zA-Z0-9.!#$%&’*+/=?^_`{|}~-]+@[a-zA-Z0-9-]+(?:\\.[a-zA-Z0-9-]+)");

new TreeMap<String, Long>(new BufferedReader(new InputStreamReader(System.in))
.lines().map(line -> {
Matcher matcher = pattern.matcher(line);
return StreamSupport.stream(
Spliterators.spliteratorUnknownSize(new MatcherIterator(matcher), Spliterator.ORDERED), false);
}).reduce(Stream.empty(), Stream::concat).collect(groupingBy(o -> o, counting()))
).forEach((k, v) -> {
System.out.printf("%s\t%s\n",k,v);
});
}
}

最佳答案

嗯,在 Java 8 中,有 Pattern.splitAsStream 这将提供由 delimiter 模式拆分的项目流,但不幸的是不支持获取 matches 流的方法。

如果你要实现这样的 Stream , 我建议实现 Spliterator直接而不是实现和包装 Iterator .您可能更熟悉Iterator但是实现一个简单的Spliterator直截了当:

final class MatchItr extends Spliterators.AbstractSpliterator<String> {
private final Matcher matcher;
MatchItr(Matcher m) {
super(m.regionEnd()-m.regionStart(), ORDERED|NONNULL);
matcher=m;
}
public boolean tryAdvance(Consumer<? super String> action) {
if(!matcher.find()) return false;
action.accept(matcher.group());
return true;
}
}

您可以考虑覆盖 forEachRemaining不过,有一个直接的循环。


如果我正确理解您的尝试,解决方案应该更像:

Pattern pattern = Pattern.compile(
"[a-zA-Z0-9.!#$%&’*+/=?^_`{|}~-]+@[a-zA-Z0-9-]+(?:\\.[a-zA-Z0-9-]+)");

try(BufferedReader br=new BufferedReader(System.console().reader())) {

br.lines()
.flatMap(line -> StreamSupport.stream(new MatchItr(pattern.matcher(line)), false))
.collect(Collectors.groupingBy(o->o, TreeMap::new, Collectors.counting()))
.forEach((k, v) -> System.out.printf("%s\t%s\n",k,v));
}

Java 9 提供了一个方法 Stream<MatchResult> results() 直接上Matcher .但是对于在流中查找匹配项,有 an even more convenient method on Scanner .这样,实现就简化为

try(Scanner s = new Scanner(System.console().reader())) {
s.findAll(pattern)
.collect(Collectors.groupingBy(MatchResult::group,TreeMap::new,Collectors.counting()))
.forEach((k, v) -> System.out.printf("%s\t%s\n",k,v));
}

This answer包含 Scanner.findAll 的后向端口可与 Java 8 一起使用。

关于java - 如何创建正则表达式匹配流?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28148483/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com