gpt4 book ai didi

machine-learning - 可以使用哪些算法来匹配句子?

转载 作者:行者123 更新时间:2023-11-30 09:29:19 25 4
gpt4 key购买 nike

假设我们有一个包含 50 个句子的列表,并且有一个输入句子。如何从列表中选择与输入句子最接近的句子?

我尝试了很多方法/算法,例如对句子的每个标记的 word2vec 向量表示进行平均,然后对结果向量进行余弦相似度。

例如,我希望算法在“书的定义是什么?”之间给出较高的相似度分数。和“请定义书”。

我正在寻找一种方法(可能是方法的组合)1.寻找语义2. 寻找语法3.为具有不同角色的不同标记赋予不同的权重(例如,在第一个示例中,“what”和“is”应该获得较低的权重)

我知道这可能有点笼统,但任何建议都会受到赞赏。

谢谢

阿米尔

最佳答案

在计算句子之间的距离之前,你需要清理它们,

为此:

  1. 需要对单词进行词形还原才能获得每个单词的词根,因此您的句子“book 的定义是什么”将是“bood 的定义是什么”

  2. 您需要删除所有介词、动词 to be 和所有没有意义的单词,例如:“什么 be bood 的定义”将是“definintion book”

  3. 然后使用 tf-idf 方法或 wordToVec 将句子转换为数字向量。

  4. 最后,您可以使用向量之间的余弦来计算句子之间的距离,因此如果余弦很小,则两个句子相似。

希望这会有所帮助

关于machine-learning - 可以使用哪些算法来匹配句子?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41273779/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com