gpt4 book ai didi

Java:查找两个数据源中出现了多少个单词?

转载 作者:搜寻专家 更新时间:2023-11-01 01:58:13 25 4
gpt4 key购买 nike

我想弄清楚是否有一种简单的方法来计算出现在小段落 (#1) 和小段落 (#2) 中的单词数。

通常,我会逐字确定这些段落中有多少重叠。因此,如果 (#1) 包含单词“happy”并且 (#2) 包含单词“happy”,这就像一个 +1 值。

我知道我可以为 (#1) 中应用于 (#2) 的每个单词使用 String.contains()。但我想知道是否有更有效的方法可以使用

最佳答案

您可以创建两个集合 s1 和 s2,分别包含第一段和第二段中的所有单词,并将它们相交:s1.retainAll(s2)。听起来很简单。

更新
对我有用

    Set<String> s1 = new HashSet<String>(Arrays.asList("abc xyz 123".split("\\s")));
Set<String> s2 = new HashSet<String>(Arrays.asList("xyz 000 111".split("\\s")));
s1.retainAll(s2);
System.out.println(s1.size());

不要忘记从两组中删除空词。

关于Java:查找两个数据源中出现了多少个单词?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3096902/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com