gpt4 book ai didi

java - 计算文本文件中的单词数时跳过字符串的前几个单词

转载 作者:行者123 更新时间:2023-12-01 14:31:23 25 4
gpt4 key购买 nike

我正在尝试计算具有以下格式的文本文件中的字数:

TITEL####URL####ABSTRACT\n
TITEL####URL####ABSTRACT\n
TITEL####URL####ABSTRACT\n

像这样:

 Available line####http://en.wikipedia.org/wiki/Available_line####In voice,
Marwan al-Shehhi####http://en.wikipedia.org/wiki/Marwan_al-Shehhi####Marwan etc.
Theodore Beza####http://en.wikipedia.org/wiki/Theodore_Beza####Theodore Beza etc.

我的单词计数代码如下所示:

    public static int countTotalWords() {
totalWords = 0;

try {
FileInputStream fis;
fis = new FileInputStream(fileName);


Scanner scan = new Scanner(fis);

while (scan.hasNext()) {
totalWords++;
scan.next();
}
} catch (FileNotFoundException ex) {
Logger.getLogger(Opgave1.class.getName()).log(Level.SEVERE, null, ex);
}
return totalWords;
}

我假设它有效......

我只想计算摘要中的字数,因此忽略标题和 URL。我猜 #### 可以用来跳过每行的第一部分,但对于我的一生,我无法弄清楚如何。如有任何帮助,我们将不胜感激!

最佳答案

您可以拆分字符串:

String s = "TITEL####URL####ABSTRACT\n";
String[] tokens = s.split("#+");
String abstractText = tokens[2];

然后要计算可以进一步拆分的单词数:

int count = abstractText.split("\\s+").length;

注意:如果您使用 Java 7+ 并且您的文件不是太大,您还可以使用以下方式读取它:

List<String> lines = Files.readAllLines(file, charset);

关于java - 计算文本文件中的单词数时跳过字符串的前几个单词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16847303/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com