gpt4 book ai didi

python - 使用 TensorFlow 进行成对距离计算

转载 作者:太空狗 更新时间:2023-10-29 17:15:35 25 4
gpt4 key购买 nike

我正在尝试实现这篇文章: http://ronan.collobert.com/pub/matos/2008_deep_icml.pdf特别是第 2 节中的等式 (3)。

不久我想对每个小批量的特征进行成对距离计算,并将此损失插入到一般网络损失中。我只有批处理的 Tesnor(16 个样本)、批处理的标签张量和批处理特征张量。

找了半天还是没搞清楚:

1) 如何将批处理划分为正(即相同标签)和负对。由于张量不可迭代,我无法弄清楚如何获取哪个样本具有哪个标签然后划分我的向量,或者获取张量的哪些索引属于每个类。

2) 如何对批量张量中的某些指标进行成对距离计算?

3) 我还需要为反例定义一个新的距离函数

总的来说,我需要获取哪些索引属于哪个类,对所有正对进行正对距离计算。并对所有负对进行另一次计算。然后将其全部加起来并添加到网络损失中。

任何帮助(对 3 个问题中的一个以上)将不胜感激。

最佳答案

1)您应该在将数据输入 session 之前进行配对采样。为每对标记一个 bool 标签,假设 y = 1 表示匹配对,否则为 0。

2) 3) 只需计算每对的正/负项,然后让 0-1 标签 y 选择将哪个添加到损失中。


首先创建占位符,y_ 用于 bool 标签。

dim = 64
x1_ = tf.placeholder('float32', shape=(None, dim))
x2_ = tf.placeholder('float32', shape=(None, dim))
y_ = tf.placeholder('uint8', shape=[None]) # uint8 for boolean

然后可以通过函数创建损失张量。

def loss(x1, x2, y):
# Euclidean distance between x1,x2
l2diff = tf.sqrt( tf.reduce_sum(tf.square(tf.sub(x1, x2)),
reduction_indices=1))

# you can try margin parameters
margin = tf.constant(1.)

labels = tf.to_float(y)

match_loss = tf.square(l2diff, 'match_term')
mismatch_loss = tf.maximum(0., tf.sub(margin, tf.square(l2diff)), 'mismatch_term')

# if label is 1, only match_loss will count, otherwise mismatch_loss
loss = tf.add(tf.mul(labels, match_loss), \
tf.mul((1 - labels), mismatch_loss), 'loss_add')

loss_mean = tf.reduce_mean(loss)
return loss_mean

loss_ = loss(x1_, x2_, y_)

然后提供您的数据(例如随机生成):

batchsize = 4
x1 = np.random.rand(batchsize, dim)
x2 = np.random.rand(batchsize, dim)
y = np.array([0,1,1,0])

l = sess.run(loss_, feed_dict={x1_:x1, x2_:x2, y_:y})

关于python - 使用 TensorFlow 进行成对距离计算,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37479119/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com