gpt4 book ai didi

java - 如何拆分字符串并仅保留某些短语? (JAVA)

转载 作者:行者123 更新时间:2023-12-02 01:54:19 30 4
gpt4 key购买 nike

我正在尝试过滤字符串并仅保留某些短语,尝试开发业余代码语法检查器。例如:

String line = "<html><head><title>HELLO WORLD</title></head><body>Hello WorldMy name is Ricardo i hope you are all doing good</body></html>";

String[] splitt = line.split("\\<html>|\\</html>|\\<head>|\\</head>|\\<title>|\\</title>|\\<body>|\\</body>");

for (String split: splitted) {
System.out.println(split);
}
}

我想获取所有 token ,例如 <html> , </html> , <title> , </title>有了上面的代码,我得到的结果完全相反,基本上过滤掉了我想要的东西。

提前致谢!我一整天都在紧张地试图找出答案。

最佳答案

如果您正在查找字符串中的某些短语,那么您可以使用 java Regex 来查找所需的输出。只需创建所需字符串的正则表达式并使用它即可。

Pattern pattern=Pattern.compile("Your Regex");  
Matcher matcher=pattern.matcher("Source String");

while (matcher.find()) // true if matches
{
System.out.println(matcher.group()); //prints string token
}

当前您正在使用 split(regex) ,它将通过给定的正则表达式分割字符串,因此它将省略分割器 <html>,</html>等等

关于java - 如何拆分字符串并仅保留某些短语? (JAVA),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52510918/

30 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com