gpt4 book ai didi

R - 速度优化和国际象棋排名

转载 作者:塔克拉玛干 更新时间:2023-11-03 02:49:35 24 4
gpt4 key购买 nike

您好!

我正在尝试计算 6 种不同技能(C1、C2、...C6)的许多玩家的国际象棋排名。我有一个巨大的游戏数据框(数据),看起来像这个(头(数据))。在这个游戏中,一个人(用户)在另外两个人(p1/p2)之间选择获胜。

row.names   user    p1  p2  skill   win looser       time
---------------------------------------------------------
2 KE CL HK C1 CL HK 433508371
25 KE HK JT c1 HK JT 433508401
35 KE AB JT C1 AB JT 433508444
110 NF IP HE C1 HE IP 433508837
78 NF IP AS C1 AS IP 433508848
82 NF IT CV C1 CV IT 433508860

在另一个表 (old_users) 中,我跟踪所有玩家在 6 种技能 (head(old_users)) 中的国际象棋得分

    user    C1    C2    C3    C4    C5    C6                                    
1 BD 1200 1200 1200 1200 1200 1200
2 NF 1200 1200 1200 1200 1200 1200
3 CH 1200 1200 1200 1200 1200 1200
4 AR 1200 1200 1200 1200 1200 1200
5 AS 1200 1200 1200 1200 1200 1200
6 MS 1200 1200 1200 1200 1200 1200

算法该算法在 for 循环中一次一行地遍历数据,每次查看第 i 行。该算法将查找 p1 和 p2 的得分数据,检索两个玩家的技能得分。然后根据谁赢谁输计算他们的新分数,然后用相应的新排名更新 old_users 单元格。

我需要做什么我需要尽快执行此操作,并且数据框数据现在只有 24 名玩家的 6000 多行,需要一段时间才能完成。

我已经尝试为我当前的 for 循环计时,它给出了以下太多的时间。

  user   system  elapsed 
104.72 0.28 118.02

问题

  1. 为什么这个算法要花这么长时间来运行?在 for 循环等中是否有任何不好的命令?
  2. 我怎样才能更快地实现我想要的目标?

当前for循环

for (i in 1:dim(data)[1]) {
tmp_data<-data[i,] #Take the i'th row in data
score_col<-which(colnames(old_users)==tmp_data$skill) #find old_user column which matched the skill played
winners_old_data<-old_users[which(old_users$user==tmp_data$win),] #Fetch winner's old scores
loosers_old_data<-old_users[which(old_users$user==tmp_data$looser),] #Fetch looser's old scores


winners_new_score=winners_old_data[score_col]+(32/2)*(1-0+(1/2)*((loosers_old_data[score_col]-winners_old_data[score_col])/200)) #Calculate the winner's new score
loosers_new_score=loosers_old_data[score_col]+(32/2)*(0-1+(1/2)*((winners_old_data[score_col]-loosers_old_data[score_col])/200)) #Calculate the looser's new score

old_users[old_users$user==winners_old_data[[1]],score_col]<-winners_new_score #update cell in old_users
old_users[old_users$user==loosers_old_data[[1]],score_col]<-loosers_new_score #update cell in old_users
}

要玩的数据

https://drive.google.com/file/d/0BxE_CHLUGoS0WlczUkxLM3VtVjQ/edit?usp=sharing

非常感谢任何帮助

谢谢!

//香港

最佳答案

您发布的数据小得离谱!想想我必须安装一些东西来解压它......!如果您可以发布更大的数据,我将能够测试我的建议有多大用处。

我建议您将用户数据转换为一个矩阵,其中 id 作为行名,技能作为列名。为什么?

  1. 通过正常索引访问数据,而不是到处使用 which( == ),您的速度可能会略有提高。或者至少它会使您的代码更具可读性。

  2. 更重要的是,改变矩阵中的值是在内存方面就地完成的;而使用 data.frame,我认为您的代码每次都在创建全新的对象,这一定很耗时。


# read and transform your data
data <- read.csv("data.txt", header = FALSE)
names(data) <- c("user", "p1", "p2", "skill", "win", "looser", "time")
users <- data.matrix(read.csv("users.txt", header = FALSE, row.names = 1))
colnames(users) <- paste("C", 1:6)

for (i in 1:nrow(data)) {
game <- data[i,]
winner.old <- users[game$win, game$skill]
looser.old <- users[game$looser, game$skill]
winner.new <- winner.old + 32/2 * (1 - 0 + (1/2) * (looser.old-winner.old) / 200)
looser.new <- looser.old + 32/2 * (0 - 1 + (1/2) * (winner.old-looser.old) / 200)
users[game$win, game$skill] <- winner.new
users[game$looser, game$skill] <- looser.new
}

是不是读起来容易多了?希望它也会快一点,请测试并告诉我。或者提供我们可以玩的更大的数据集。谢谢。

关于R - 速度优化和国际象棋排名,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26140401/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com