gpt4 book ai didi

string - 如何从一堆字符串中提取常用词

转载 作者:塔克拉玛干 更新时间:2023-11-03 05:34:02 24 4
gpt4 key购买 nike

假设我们有这样的字符串:

Tommy is a very good child
Tommy has a very wonderful child
Tommy loves his very child

我想提取上面3个字符串的常用词为:

Tommy*very*child 

我应该怎么做?谢谢。

最佳答案

您可以使用称为倒排索引的数据结构

首先,您为每个输入字符串分配一个唯一的整数。然后,我们的想法是,对于输入字符串中的每个单词,您想要计算一个整数列表,表示出现该单词的字符串。请注意,您只需处理所有输入字符串即可轻松做到这一点。在您的情况下,为了获得所有字符串中出现的单词,您可以输出出现列表中的条目数与输入中的字符串数相同的单词。

更多详情,请引用这里:

https://en.wikipedia.org/wiki/Inverted_index

关于string - 如何从一堆字符串中提取常用词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34427736/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com