gpt4 book ai didi

读取文本文件时的 Java 定界符 - 正则表达式/或不是?

转载 作者:塔克拉玛干 更新时间:2023-11-02 19:00:15 27 4
gpt4 key购买 nike

我正在尝试读取以这种形式编写的文本文件:

    AB523:[joe, pierre][charlie][dogs,cat]
ZZ883:[ronald, zigomarre][pele]

我想创建我的结构并正确检索信息。

AB523 --- 独自一人
乔,皮埃尔---独自一人
查理---独自一人
狗,猫 --- 一个人

我不确定应该使用什么是最好的技术。我已经尝试过 StringTokenizer ...并使用了 regEx,但我做错了

你有什么解决办法吗?或建议

在文本文件中写入时的约定是什么?使用分隔符的最佳做法是什么?

编辑:文本文件也是我生成的,所以我可以控制整个模式。在重新阅读时减少工作量的最佳输出模式是什么?

最佳答案

我会在这里使用正则表达式,因为它看起来需要维护的代码更少,而且您的语言肯定是正则的。连同 java.util.Scanner 实例以提高效率。这是一些代码:

import java.io.Reader;
import java.io.StringReader;
import java.util.Scanner;
import java.util.regex.Pattern;

public class ScannerTest {

private static final Pattern header = Pattern.compile("(.*):");
private static final Pattern names = Pattern.compile("\\[([^\\]]+)\\]");

public static void main(String[] args) {

Reader reader = new StringReader(
"AB523:[joe, pierre][charlie][dogs,cat]\n"
+ "ZZ883:[ronald, zigomarre][pele]");

Scanner scanner = new Scanner(reader);
scanner.useDelimiter("\n");

while (scanner.hasNext()) {
String h = scanner.findInLine(header);
// Substring removes trailing ':'.
System.out.println(h.substring(0, h.length() - 1));

String n;
while ((n = scanner.findInLine(names)) != null)
// Substring removes '[' and ']'.
System.out.println(n.substring(1, n.length() - 1));

if (scanner.hasNext())
scanner.nextLine();
}
}
}

尽管如此,我仍然无法删除子字符串调用,也许这隐藏了一些低效率。我的猜测是,由于字符串的不变性,不应为这种情况重新创建字符串。

编辑:为了获得更好的性能,我还会考虑手工制作 recursive descent parser .

关于读取文本文件时的 Java 定界符 - 正则表达式/或不是?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7962235/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com