gpt4 book ai didi

java - 读取多个文件,然后分隔字符串

转载 作者:行者123 更新时间:2023-12-01 12:47:01 25 4
gpt4 key购买 nike

我已经使用StringTokenizer读取了多个文件并读取了 token ,但我的问题是它读取“Geneliad'souza”是一样的,但我希望它是“geneliad”和“souza”单独的单词。您能解释一下这个逻辑的代码吗?

单词以字母(A-Z 或 a-z)开头,直到遇到非字母(或 EOF)。

我的代码片段:

String line = fileReader.nextLine();
String word = null;

StringTokenizer st = new StringTokenizer(line);

while (st.hasMoreTokens()) { // while2 starts
word = st.nextToken().toLowerCase();
...

最佳答案

StringTokenizer 不应该(感谢 laune )与多个 String 作为分隔符一起使用,但您希望它与某些变体一起使用。另外,如javadoc说,“StringTokenizer 是一个遗留类,出于兼容性原因而保留”,因此您应该避免在代码中使用它并使用这种方式:

String[] words = line.split("[^a-zA-Z]+");

这里的正则表达式将匹配除字母之外的任何字符(字符序列)。

关于java - 读取多个文件,然后分隔字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24598504/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com