- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
给定一个字符串,我想按照扫描的顺序匹配标记,而不是通过循环无序打印特定类型标记的所有匹配项。
目前,我在 for-each 循环中迭代字符串数组。我的正则表达式可以捕获所有必要的标记,但不是按照它们出现的顺序。
这是我所拥有的。 for-each 循环调用 findTokens 函数来查找所有该 token 类型。这是错误的,因为这样它会通过正则表达式匹配而不是它们出现的顺序来查找 token 。
for(String line: lines) {
...
findTokens(line, keyword);
findTokens(line, identifier);
findTokens(line, number);
}
这是我的 findTokens 函数。它接受一个字符串和一个正则表达式。它检查 Regex 参数是否等于 Regex 声明之一(未显示)。
public static void findTokens(String str, String regex) {
String keyword = "(else)+|(if)+|(int)+|(return)+|(void)+|(while)+|(main)+";
String identifier = "\\b(?!(else)|(if)|(int)|(return)|(void)|(while)|(main))\\b[a-zA-Z]+";
String number = "[\\d]+";
Pattern pattern = Pattern.compile(regex);
Matcher matcher = pattern.matcher(str);
if (regex.equals(keyword) ) {
while ( matcher.find() ) { System.out.println("Keyword: " + matcher.group()); }
} else if ( regex.equals(identifier) ) {
while ( matcher.find() ) { System.out.println("ID: " + matcher.group()); }
} else if ( regex.equals(number) ) {
while ( matcher.find() ) { System.out.println("NUM: " + matcher.group()); }
}
}
预期输出:
INPUT: int g 4 cd int u int v
keyword: int
ID: g
NUM: 4
ID: cd
keyword: int
ID: u
keyword: int
ID: v
实际输出:
INPUT: int g 4 cd int u int v
keyword: int
keyword: int
keyword: int
ID: g
ID: cd
ID: u
ID: v
NUM: 4
最佳答案
将它们组合成一个大的正则表达式,如下所示:
package test;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class Test {
public static void main(String[] args) throws Exception {
String input = Files.readString(Paths.get("src/main/java/test/Test.java"));
String keyword = "\\b(?:else|if|int|return|void|while|for|package|import|public|protected|private|static|class|throws)\\b";
String identifier = "\\b[a-zA-Z][a-zA-Z0-9]*\\b";
String number = "-?\\b[\\d]+\\b";
String regex = "(" + keyword + ")|(" + identifier + ")|(" + number + ")";
Pattern pattern = Pattern.compile(regex);
for (Matcher m = pattern.matcher(input); m.find(); ) {
if (m.start(1) != -1)
System.out.println("Keyword: " + m.group());
else if (m.start(2) != -1)
System.out.println("Identifier: " + m.group());
else
System.out.println("Number: " + m.group());
}
}
}
该代码使用自己的源代码作为测试,因此输出为:
Keyword: package
Identifier: test
Keyword: import
Identifier: java
Identifier: nio
Identifier: file
Identifier: Files
Keyword: import
Identifier: java
Identifier: nio
Identifier: file
Identifier: Paths
Keyword: import
Identifier: java
Identifier: util
Identifier: regex
Identifier: Matcher
Keyword: import
Identifier: java
Identifier: util
Identifier: regex
Identifier: Pattern
Keyword: public
Keyword: class
Identifier: Test
Keyword: public
Keyword: static
Keyword: void
Identifier: main
Identifier: String
Identifier: args
Keyword: throws
Identifier: Exception
Identifier: String
Identifier: input
Identifier: Files
Identifier: readString
Identifier: Paths
Identifier: get
Identifier: src
Identifier: main
Identifier: java
Identifier: test
Identifier: Test
Identifier: java
Identifier: String
Identifier: keyword
Identifier: b
Keyword: else
Keyword: if
Keyword: int
Keyword: return
Keyword: void
Keyword: while
Keyword: for
Keyword: package
Keyword: import
Keyword: public
Keyword: protected
Keyword: private
Keyword: static
Keyword: class
Keyword: throws
Identifier: b
Identifier: String
Identifier: identifier
Identifier: b
Identifier: a
Identifier: zA
Identifier: Z
Identifier: a
Identifier: zA
Identifier: Z0
Number: -9
Identifier: b
Identifier: String
Identifier: number
Identifier: b
Identifier: d
Identifier: b
Identifier: String
Identifier: regex
Identifier: keyword
Identifier: identifier
Identifier: number
Identifier: Pattern
Identifier: pattern
Identifier: Pattern
Identifier: compile
Identifier: regex
Keyword: for
Identifier: Matcher
Identifier: m
Identifier: pattern
Identifier: matcher
Identifier: input
Identifier: m
Identifier: find
Keyword: if
Identifier: m
Identifier: start
Number: 1
Number: -1
Identifier: System
Identifier: out
Identifier: println
Identifier: Keyword
Identifier: m
Identifier: group
Keyword: else
Keyword: if
Identifier: m
Identifier: start
Number: 2
Number: -1
Identifier: System
Identifier: out
Identifier: println
Identifier: Identifier
Identifier: m
Identifier: group
Keyword: else
Identifier: System
Identifier: out
Identifier: println
Identifier: Number
Identifier: m
Identifier: group
关于java - 使用多个正则表达式: Print One Match at a Time in Order They are Seen,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57664226/
注意:这不是库存控制系统。我只是想绘制给哪个患者服用哪种药物的 map 。我没有考虑多少药包等。只是一次用药事件 我对数据库关系突然感到困惑,即使在与他们合作多年之后也是如此。以下是我的情况。 我有一
当用 PHP 发送群发邮件时,是向每个订阅者发送一封电子邮件(对所有电子邮件地址运行一个 for 循环)更好,还是仅将密件抄送中的所有内容添加到逗号分隔的列表中,并且因此只发送一封电子邮件? 谢谢。
我不确定我是否正确地为这种类型的关系建模,也许有人可以提供一些见解来判断这是否合理: 假设我们有一个典型的亲子类型关系,其中每个 parent 都可以有很多 child ,但我们需要跟踪 parent
我有模板和模板版本。一个模板可以有多个 template_version,但在任何给定时间只有一个事件的 template_version。我有以下两个模型: class Template 'Tem
如果我的代码是这样的: if($seconds < 60) $interval = "$seconds seconds ago"; else if($seconds < 3600) $
当我创建一对一关系迁移时,laravel 创建一对多关系。 PHP 7.1 和 MySQL 5.7 模型是:角色和用户。 角色: public function user() { return
这个问题在这里已经有了答案: 关闭 11 年前。 Possible Duplicate: Java Strings: “String s = new String(”silly“);” 我正在浏览一
我正在创建一个社交网络,用户可以在其中上传和发布他们的图像和视频。现在,我不知道是否最好在我的数据库中创建一个表,将其命名为 media,并有一个 media_type 列或创建单独的图像和视频表。这
有n个线程可以访问的单例类。 每个线程加载此类的实例并在循环中调用此类的方法。 我必须控制执行流程,这样每个线程都可以调用第一个方法并暂停,只有在所有线程调用该方法一次之后,才必须恢复它们的工作。线程
存在参数数量未知(动态构建)的 MySQL 查询,其格式如下: SELECT * FROM actions WHERE user1 = ? AND user10 = ? AND user11 = ?
我检查了维基百科页面,但找不到它们之间的区别,两者似乎都将多类转换为多个线性分类器。 最佳答案 这是关于分割训练数据的策略。假设您有 N 个包含 C 类的数据样本。 一对一:在这里,您一次选择 2 个
我尝试在 sql 中插入多行。但它仅插入最后一行,并且在该行中仅存储每列的第一个字符。我通过 echo 打印查询,它只显示最后一行,但给出了每列的所有字符。另一件事是我通过单击提交按钮在两个表中插入值
我有两个实体:个人和公司。一家公司有一个或多个联系人(人)。公司至少有一个主要联系人(人)。实现这一点的最佳方法是什么? 实体如下: public class Person { public
我是 iOS 开发的新手,已经开始使用 Swift。我目前正在使用包含 3 个选项卡/导航的选项卡栏导航。我应该将 UIViewController 子类化并将其用于所有 3 个场景,还是每个场景都应
我的要求是,我需要打开两个窗口,但第二个窗口必须在第一个窗口打印并关闭后打开。可能吗? 但第二个窗口与第一个窗口同时打开。 HTML/JSP 代码打印 Java脚本函数打印(id){
经过几个小时的反复试验,我找到了这个 thread其中解释了如何建立具有相同两种类型的一对多关系和一对一关系。 但是,我无法让它与级联删除一起使用: Thrown: "Unable to determ
我想验证我的表单,如果任何输入字段为空,错误警告将显示在空白输入字段旁边。对于空白输入,错误信息必须一次全部输出,而不是一一显示。如何做到这一点? 下面是我的javascript代码: fun
我有一系列这样的字体值(命令分隔一行): Yeseva+One, Yrsa, ... 我正在寻找一个 SED(或其他 bash 工具表达式)来将每个值转换为这样的行语句: --font-yeseva-
我正在研究 中的核心音频转换服务 Learning Core Audio 我对他们 sample code 中的这个例子感到震惊: while(1) { // wrap the destina
关闭。这个问题需要更多focused .它目前不接受答案。 想改进这个问题吗? 更新问题,使其只关注一个问题 editing this post . 关闭 9 年前。 Improve this qu
我是一名优秀的程序员,十分优秀!