gpt4 book ai didi

java - 正则表达式捕获重复单词(文本中超过 1 2 个重复)

转载 作者:行者123 更新时间:2023-12-01 12:25:59 24 4
gpt4 key购买 nike

我想用JAVA编写一个程序,捕获文本内容中重复超过2次的单词。

  • 此重复次数可以是 3、4、5 次或多次。
  • 重复可能会散布在文本周围,并且没有任何顺序。
  • 我还需要保留重复次数。
  • 不应区分大小写。

例如:红笔上的蓝皮书是我见过的最大的书。结果::3

对于这个问题,正确的正则表达式模式是什么?

最佳答案

我建议使用以下算法,而不是尝试通过正则表达式解决这个问题:

  1. 将句子拆分为单词(使用空格)并将其小写版本存储在 List<String> 中.
  2. 将 map 声明为 HashMap<String, Integer> .
  3. 重复你的话 List并继续存储在 map 中。
  4. 如果Map当时没有这个词的条目 key=word, value=1
  5. 否则,将值加 1,得出每个单词的频率。
  6. 每次频率超过 2 时,都会将该单词存储在输出中 HashSet<String>
  7. 在循环结束时只需打印 HashSet<String>

关于java - 正则表达式捕获重复单词(文本中超过 1 2 个重复),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26327740/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com