gpt4 book ai didi

JAVA:用于文档比较的最佳数据结构?

转载 作者:行者123 更新时间:2023-11-30 03:34:58 27 4
gpt4 key购买 nike

我正在编写一个程序,根据多个文档的共同词来比较它们。我能够标记所有单词并将它们全部存储在 ArrayList 中,因为它允许重复。但是,我不确定这是否是最好的方法。我需要在 ArrayList 中找到最常见的 50 个单词,但我不太确定该怎么做。有没有更好的数据结构来完成这个操作?

最佳答案

如果您只想比较出现的次数,您可以使用 map ,例如 HashMap , TreeMap ,或任何 other implementation .

键是单词(字符串),值是出现次数(整数)。您将仔细检查文档,并查找 map 中的每个单词。如果存在,则获取其当前出现的次数,并将其加一。如果没有,请插入出现次数为零的单词。这是一个代码片段:

    HashMap<String, Integer> occurenceMap = new HashMap<>();

for (String word : document) {
Integer wordOccurences = occurenceMap.get(word);
if (wordOccurences == null) {
wordOccurences = Integer.valueOf(1);
} else {
wordOccurences += 1;
}
occurenceMap.put(word, wordOccurences);
}

关于JAVA:用于文档比较的最佳数据结构?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28227236/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com