r - R 中的 TrueSkill 实现-6ren

r - R 中的 TrueSkill 实现

转载作者：塔克拉玛干更新时间：2023-11-03 03:24:14

25

4

我正在尝试编写基本的 Vanilla TrueSkill (3.1) R 中的算法，但得到了一些奇怪的结果。

我的代码如下:

# A simple test between two players repeatedly laying one another
betaSq = 0.1
obs = 10000

p1_skills = 0.333
p2_skills = 0

p1_draws = rnorm(obs, p1_skills, sqrt(betaSq))
p2_draws = rnorm(obs, p2_skills, sqrt(betaSq))

p1_pred_mu = rep(NA, obs+1)
p1_pred_sigmaSq = rep(NA, obs+1)
p2_pred_mu = rep(NA, obs+1)
p2_pred_sigmaSq = rep(NA, obs+1)

# Initial values
p1_pred_mu[1] = 0
p1_pred_sigmaSq[1] = 1
p2_pred_mu[1] = 0
p2_pred_sigmaSq[1] = 1

results = p1_draws > p2_draws
probs = rep(NA, obs)

# Run TrueSkill
for (i in seq(2,obs+1)) {
  probs[i-1] = predictProb(p1_pred_mu[i-1], p1_pred_sigmaSq[i-1], p2_pred_mu[i-1], p2_pred_sigmaSq[i-1], betaSq)
  out = updateSkill(p1_pred_mu[i-1], p1_pred_sigmaSq[i-1], p2_pred_mu[i-1], p2_pred_sigmaSq[i-1], betaSq, results[i-1])

  # Now update based on the out  
  p1_pred_mu[i] = out$mu1
  p1_pred_sigmaSq[i] = out$sigmaSq1
  p2_pred_mu[i] = out$mu2
  p2_pred_sigmaSq[i] = out$sigmaSq2
}

# Output results
dev.new()
mu = p1_pred_mu
lower = qnorm(0.05, p1_pred_mu, p1_pred_sigmaSq)
upper = qnorm(0.95, p1_pred_mu, p1_pred_sigmaSq)
plot(mu, ylim = c(min(lower), max(upper)), main = "p1")
lines(lower)
lines(upper)

dev.new()
mu = p2_pred_mu
lower = qnorm(0.05, p2_pred_mu, p2_pred_sigmaSq)
upper = qnorm(0.95, p2_pred_mu, p2_pred_sigmaSq)
plot(mu, ylim = c(min(lower), max(upper)), main = "p2")
lines(lower)
lines(upper)

a = filter(probs, rep(1, 20))/20
dev.new()
plot(a)

print(sprintf("Mean p1: %g", mean(p1_pred_mu)))
print(sprintf("Mean p2: %g", mean(p2_pred_mu)))
print(sprintf("Mean results: %g", mean(results)))
print(sprintf("Mean predicted results: %g", mean(probs)))

调用的函数有:

# Functions
updateSkill <- function(mu1, sigmaSq1, mu2, sigmaSq2, betaSq, result) {
  # http://papers.nips.cc/paper/3331-trueskill-through-time-revisiting-the-history-of-chess.pdf
  c = 2*betaSq + sigmaSq1 + sigmaSq2

  if (result == 1) {
    # Player 1 wins
    v = dnorm((mu1-mu2)/c)/pnorm((mu1-mu2)/c)
    w = v*(v+(mu1-mu2)/c)

    mu1 = mu1 + (sigmaSq1/c)*v
    mu2 = mu2 - (sigmaSq2/c)*v

    sigmaSq1 = sigmaSq1 * sqrt(1 - (sigmaSq1/c^2)*w)
    sigmaSq2 = sigmaSq2 * sqrt(1 - (sigmaSq2/c^2)*w)
  } else if (result == 0) {
    # Player 2 wins
    v = dnorm((mu2-mu1)/c)/pnorm((mu2-mu1)/c)
    w = v*(v+(mu2-mu1)/c)

    mu1 = mu1 - (sigmaSq1/c)*v
    mu2 = mu2 + (sigmaSq2/c)*v

    sigmaSq1 = sigmaSq1 * sqrt(1 - (sigmaSq1/c^2)*w)
    sigmaSq2 = sigmaSq2 * sqrt(1 - (sigmaSq2/c^2)*w)    
  }

  return(list(mu1=mu1, mu2=mu2, sigmaSq1=sigmaSq1, sigmaSq2=sigmaSq2))
}

predictProb <- function(mu1, sigmaSq1, mu2, sigmaSq2, betaSq) {
  # Try to predict the probability of player 1 beating player 2 using Trueskill model
  mean1 = mu1
  mean2 = mu2
  var1 = sigmaSq1 + betaSq
  var2 = sigmaSq2 + betaSq

  # Now the dist of player1 - player2 is N(mean1 - mean2, sqrt(var1 + var2))
  prob1Wins = pnorm(0, mean2 - mean1, sqrt(var1 + var2))

  return(prob1Wins)
}

我讨厌发布大量代码块，但我真的无法弄清楚哪里出了问题。

该程序运行并且预测的技能(分配给 N(mu, sigma))收敛。然而，他们给出的预测概率并没有收敛到结果的真实概率!

示例输出是:

[1] "Mean p1: 0.0762161"
[1] "Mean p2: -0.0762161"
[1] "Mean results: 0.7733"
[1] "Mean predicted results: 0.631424"

知道出了什么问题吗？

最佳答案

这不起作用的原因是因为在 updateSkills 函数的第 3 行它应该读取

c = sqrt(2*betaSq + sigmaSq1 + sigmaSq2)

不是

c = 2*betaSq + sigmaSq1 + sigmaSq2

关于r - R 中的 TrueSkill 实现，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/32145086/

25

4

0

文章推荐： algorithm - 给定高度的二叉搜索树的数量

文章推荐： javascript - 我们如何优化 Google 的自动完成功能？

文章推荐： java - RecursiveToStringStyle 和 JSON_STYLE 如何使用 commons-lang3

python - Trueskill 将评级保存到数据库
我找到了一个非常好的 Python 模块，知道是 Trueskill。 http://trueskill.org/ 我遇到的问题是，我不知道如何将评级保存到我的数据库中，然后将其加载回来(我知道如何发
algorithm - TrueSkill 对接会实现
您好! 我一直在关注有关 Microsoft TrueSkill 算法如何工作的指南 http://www.moserware.com/2010/03/computing-your-skill.htm
Python Trueskill (ELO) 分数下滑
为什么随机人群和随机获胜者，分数慢慢漂移到 0。我知道分数可能是随机的，但为什么总是负漂移？ import trueskill as ts from random import choice r =
r - R 中的 TrueSkill 实现
我正在尝试编写基本的 Vanilla TrueSkill (3.1) R 中的算法，但得到了一些奇怪的结果。我的代码如下: # A simple test between two players r
python - 从比赛结果到使用 Trueskill 进行评分(在 Python 中)
我正在尝试在 Python 中使用 Trueskill，特别是这个库:http://trueskill.org/ , 从比赛结果中生成评分。但是，我没有看到执行此操作的明显方法。根据站点上的文档，给
python - 使用 trueskill 算法，给定两个玩家的评分，我如何计算赢/输概率？
我看到这个问题在 trueskill 的讨论中出现了很多，但我还没有找到决定性的答案。我在这里使用 Python 实现: https://github.com/sublee/trueskill 我在

首页

博学

6Ren·AI

商城

r - R 中的 TrueSkill 实现