gpt4 book ai didi

python - 拉萨 NLU : Confidence Score Computation

转载 作者:太空宇宙 更新时间:2023-11-03 11:15:36 24 4
gpt4 key购买 nike

我试图了解 rasa nlu(ver-0.12.3) 输出的置信度分数实际上是什么以及它们是如何计算的。

我一直致力于使用 tensorflow 嵌入进行意图分类任务。一旦我的模型经过训练并且我解析了新/测试数据,我就会收到一个置信度分数以及每个可能的意图。但我几乎不知道这个置信度分数究竟代表什么。

文档中提到,它不代表概率。经过对结果的一些观察,这似乎是一种多类型评估,即对于单个文本输入,我可以获得具有高置信度分数的多个意图。

快速查看 code 后,我认为它是在“embedding_intent_classifier.py”文件中的“_tf_sim”函数中计算的(下面的相关代码段)

有人可以确认/澄清它是如何工作的,或者这里的置信度分数到底意味着什么?

    def _tf_sim(self, a, b):
"""Define similarity"""

if self.similarity_type == 'cosine':
a = tf.nn.l2_normalize(a, -1)
b = tf.nn.l2_normalize(b, -1)

if self.similarity_type == 'cosine' or self.similarity_type == 'inner':
sim = tf.reduce_sum(tf.expand_dims(a, 1) * b, -1)

# similarity between intent embeddings
sim_emb = tf.reduce_sum(b[:, 0:1, :] * b[:, 1:, :], -1)

return sim, sim_emb
else:
raise ValueError("Wrong similarity type {}, "
"should be 'cosine' or 'inner'"
"".format(self.similarity_type))

最佳答案

意图分类器 intent_classifier_tensorflow_embedding ( docs ) 是一种基于 StarSpace paper 的方法来自 Facebook。

在这种方法中,意图示例及其标签都嵌入到同一个多维空间中。所以意图特征向量,和这句话的标签分别乘以一个权重矩阵,将它们映射到一个n维空间。在训练期间调整这两个权重矩阵,使映射的意图向量与其标签的映射向量相似,并尽可能不同于其他标签。特此,使用 cosine similarity 来衡量相似性。 .这种相似性是1如果矢量指向同一方向,则为其他角度< 1 .

关于python - 拉萨 NLU : Confidence Score Computation,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52309420/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com