gpt4 book ai didi

ruby - 在正文中查找最常见短语的有效方法 AKA 热门话题

转载 作者:数据小太阳 更新时间:2023-10-29 07:38:40 25 4
gpt4 key购买 nike

我之前问过一个 similar question在这个主题上,我最终得出了几个有效的解决方案,一个基于布隆过滤器 + ngrams,另一个基于哈希表 + ngrams。这两种解决方案在小数据集(<1000 条文本,通常是推文)上都表现良好,但计算时间呈指数级增长,这意味着执行 10,000 次可能需要数小时。

我目前正在使用 Ruby 工作,也许这就是问题所在,但是否有任何其他解决方案或方法可以尝试解决此问题?

最佳答案

如果您希望在大型数据集中进行文本搜索,您可能需要研究类似 solr 的东西。有一个非常容易设置的名为 sunspot 的 solr gem http://outoftime.github.com/sunspot/

关于ruby - 在正文中查找最常见短语的有效方法 AKA 热门话题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3347245/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com