gpt4 book ai didi

python - 了解协作过滤的交替最小二乘法

转载 作者:太空宇宙 更新时间:2023-11-03 16:44:55 25 4
gpt4 key购买 nike

过去几天我一直在摆弄推荐引擎,并发现了这个非常好的教程,它演示了在协作过滤器中使用交替最小二乘法:http://bugra.github.io/work/notes/2014-04-19/alternating-least-squares-method-for-collaborative-filtering/

我设法按照说明进行操作,直到最后一步。这是作者编写代码来打印推荐的部分。代码片段如下:-

def print_recommendations(W=W, Q=Q, Q_hat=Q_hat, movie_titles=movie_titles):
Q_hat -= np.min(Q_hat)
Q_hat *= float(5) / np.max(Q_hat)
movie_ids = np.argmax(Q_hat - 5 * W, axis=1)
for jj, movie_id in zip(range(m), movie_ids):

print('User {} liked {}\n'.format(jj + 1, ', '.join([movie_titles[ii] for ii, qq in enumerate(Q[jj]) if qq > 3])))

print('\n User {} recommended movie is {} - with predicted rating: {}'.format( jj + 1, movie_titles[movie_id], Q_hat[jj, movie_id]))

print('\n' + 100 * '-' + '\n')

在此代码片段中,W 是权重矩阵。 Q 矩阵用于形式化评级所衡量的置信度概念。因此:

Q = 1 if user u rated item i

Q= 0 if user u did not rate item i

Q_hat是执行ALS算法后,经过指定次数的迭代后得到的新矩阵。

我不明白为什么作者要特别实现这两个步骤:

Q_hat -= np.min(Q_hat)
Q_hat *= float(5) / np.max(Q_hat)

有人可以指导我并帮助我理解这一点吗?我真的很感激。

谢谢

编辑:这是原始函数的要点链接:https://gist.github.com/arjun180/71124392b0b70f7b96a8826b59400b99

最佳答案

这是预测评分的标准化。

Q_hat -= np.min(Q_hat)

这里,作者将预测评分矩阵中的最小值减去所有预测值。

这保证所有预测评分都从 0 开始。

Q_hat *= float(5) / np.max(Q_hat)

这里,作者将预测评分标准化为 0 到 5 的范围。

关于python - 了解协作过滤的交替最小二乘法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36405436/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com