gpt4 book ai didi

java - 正则表达式:标记

转载 作者:行者123 更新时间:2023-12-02 05:54:19 24 4
gpt4 key购买 nike

我如何获得 <opening><scotch-game><fried-liver-attack> 的单独代币使用正则表达式的字符串。所以输出应该是以下 3 个字符串:

  1. 开幕
  2. 苏格兰游戏
  3. 炸肝攻击

编辑:

这不是一个正确的 xml

最佳答案

Pangea,你想用正则表达式做什么?此代码将执行您想要的操作。

List<String> matchList = new ArrayList<String>();
try {
Pattern regex = Pattern.compile("<([^>]*?)>");
Matcher regexMatcher = regex.matcher(subjectString);
while (regexMatcher.find()) {
matchList.add(regexMatcher.group(1));
}
} catch (PatternSyntaxException ex) {
// Syntax error in the regular expression
}

模式本身非常简单:<([^>]*?)>

我们匹配一个空缺< ,然后括号将非右大括号的任意数量的字符惰性捕获到组 1 中 [^>]*?最后,为了更好地衡量,我们匹配结束语 >以确保我们拥有完整的 token 。

Java 代码只是构建一个包含所有第 1 组捕获的列表,这正是您想要的。

请注意,这不会正常处理 <nested <tokens>> 。那将是另一个讨论。

关于java - 正则表达式:标记 <opening><scotch-game><fried-liver-attack>,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23251768/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com