gpt4 book ai didi

algorithm - 以数字方式表示具有与哈希码不同属性的字符串

转载 作者:塔克拉玛干 更新时间:2023-11-03 05:55:10 24 4
gpt4 key购买 nike

是否有一个类似于哈希码的函数,其中传入字符串或一组位并将其转换为数字。然而,该算法的工作原理是,彼此更相似的字符串会导致数字彼此更接近。

f("abcdefg") - f("abcdef") < f("lorem ipsum dolor") - f("abcde")

算法不一定是完美的,我只是想将一些描述转化为数字表示,作为 ML 实验的另一个输入。我知道这个字符串数据对算法有值(value),我只是想想出一些简单的方法将它变成一个数字。

最佳答案

我从您的帖子中了解到的内容与我感兴趣的 tpic 非常相似。有一个很棒的工具或流程可以完成您要求的任务。我所指的工具称为 word2vec。它给出了字符串中每个单词的矢量化。它是由谷歌发现的。在这个模型中,每个词都会根据词汇表中的词及其附近的词(下一个词和上一个词)进行向量化。从 google 或 youtube 上浏览这个 word2vec 主题,你会对它有一个清晰的认识。这个工具的力量是如此之大,以至于你可以做一些意想不到的事情。一个例子是国王 - 男人 + 女人 = 王后该工具主要用于语义分析。

关于algorithm - 以数字方式表示具有与哈希码不同属性的字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39359454/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com