gpt4 book ai didi

java - 如何在 Java 中存储仅需要 'contains' 操作的巨大静态/不可变字符串集

转载 作者:行者123 更新时间:2023-11-30 11:39:10 26 4
gpt4 key购买 nike

我有一个巨大的字符串列表(8 到 1000 万)。它们是维基百科页面标题。在这些字符串上创建类似 Set 的数据结构后,我唯一需要的操作是 boolean contains(String str)

最直接的方法是使用HashSetTreeSet 或类似的东西(例如,在 Java 中)。

是否有更适合此用例的数据结构?

PS:我们不能使用布隆过滤器,我们不想处理误报。

最佳答案

如果您比恒定时间 contains() 更关心节省空间,并且存储的字符串中有很多重叠,trie可能有帮助。在这种情况下,contains(str) 将是 O(n),其中 nstr 的长度。

关于java - 如何在 Java 中存储仅需要 'contains' 操作的巨大静态/不可变字符串集,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13409948/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com