gpt4 book ai didi

java - 根据相似性对字符串进行排序

转载 作者:搜寻专家 更新时间:2023-10-31 20:10:31 24 4
gpt4 key购买 nike

<分区>

考虑以下字符串:

  • 他你好
  • 再见
  • 你好
  • =(再见)
  • (他)(我)
  • 再见
  • 氦气

我正在尝试以相似的词放在一起的方式对它们进行排序,我知道

  1. 字母数字排序不是一个选项
  2. 删除特殊字符 ",-_ 等 然后进行比较当然有帮助,但结果不会像我希望的那样好。

注意:

可能有几个不同的期望输出,其中之一是:

期望的输出:

  1. 你好
  2. 他你好
  3. (他)(我)
  4. 氦气
  5. 再见
  6. 再见
  7. =(再见)

所以我的问题是,是否有一个 java 包可以比较字符串并最终根据它对它们进行排序。

我听说过诸如 n-gramskip-gram 之类的术语,但不太理解它们。我什至不确定它们是否对我有用。

更新:寻找相似性当然是我问题的一部分,但主要问题是排序部分。

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com