- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在寻找在 Keras(或如果需要的话 tensorflow )中训练一个神经网络来预测哪三个玩家被指定 stars在每场 NHL 曲棍球比赛中。我的 X 矩阵包含每个玩家的标准得分信息,例如上场时间、进球数、助攻数等,目标变量可以是四个类别之一(0 - 不在最佳三名中,1 - 最佳球员,2 - 第二最佳球员,3 - 第三最佳球员)。
到目前为止,这是一个非常标准的问题,普通神经网络在预测玩家被指定为明星的概率方面做得相当不错。问题是我想添加一个约束,强制单个游戏中第 1、2、3 类的概率总和为 1(所有玩家),同时保持 softmax 约束,即每个玩家的所有类的概率总和也必须为一。我注意到 conditional logistic regression模型实现了二元分类,但我还没有看到它在机器学习框架中实现。
我相信这需要 Keras 可以实现的自定义激活函数。但是我不确定数学/代码会是什么样子。
到目前为止我运行的示例代码是这样的:
# import packages
import numpy as np
from keras.layers import Dense
from keras.models import Sequential
from keras.optimizers import Adam
# generate data
games, m = 50, 40
X = np.zeros((games * m, 11))
Y = np.zeros((games * m, 4))
for i in range(games):
rowStart, rowEnd = (i) * m, (1 + i) * m
X[rowStart:rowEnd, 0] = i
X[rowStart:rowEnd, 1:] = np.random.rand(m, 10)
for j in range(1, 4):
rowInd = rowStart + np.random.randint(0, m)
while np.sum(Y[rowInd]) != 0.0:
rowInd = rowStart + np.random.randint(0, m)
Y[rowInd, j] = 1
# run model
mod2 = Sequential()
mod2.add(Dense(10, activation='relu', input_shape=(X.shape[1]-1,)))
mod2.add(Dense(6, activation='relu'))
mod2.add(Dense(4, activation='softmax'))
adam = Adam(lr=0.001)
mod2.compile(optimizer=adam, loss='categorical_crossentropy', metrics=['categorical_accuracy'])
hist = mod2.fit(X[:,1:], Y, epochs=10, batch_size=m)
最佳答案
我真的很喜欢你关于“双向 softmax”的想法。抱歉,但过了一段时间我能够证明这样的 softmax 在一般情况下是不可能的(如果感兴趣,我可以添加一个简化的描述为什么)。
但是还有其他方法可以解决这个问题,无需“双向 softmax”,并且不会违反您的限制。我建议您使用具有 10 个特征的 40 名玩家的完整游戏作为输入,并对 40 名玩家中的每一位进行排名作为输出。我建议您不要将每个玩家分为 4 个类别,而是给每个玩家一个分数(例如 -1 表示未进入最佳三名玩家,0 表示第三最佳玩家,1 表示第二最佳玩家,2 表示最佳玩家)。在预测时,您可以选择得分最大的玩家为最佳玩家,第二大的为第二好,第三大的为第三好,其余的为未进入前三名。这样,您就不会违反每个玩家都应获得“类别”的限制,并且只有一名玩家获得第一、第二和第三名。
请参阅下面的最小工作示例:
# import packages
import numpy as np
from tensorflow.keras.layers import Dense, Input, Flatten#, Reshape
from tensorflow.keras.models import Model
from tensorflow.keras.optimizers import Adam
# generate data
games, m = 50, 40
X = np.zeros((games, m, 11))
Y = np.zeros((games, m))
for i in range(games):
X[i, :, 0] = i
X[i, :, 1:] = np.random.rand(m, 10)
y_indexes = np.arange(m)
np.random.shuffle(y_indexes)
# score players
Y[i,y_indexes[0]] = 2 # best
Y[i,y_indexes[1]] = 1 # second best
Y[i,y_indexes[2]] = 0 # third best
Y[i,y_indexes[3:]] = -1 # not best
# run model
inputs = Input(shape=(m,10)) # -1 as we dont use fist column (game number)
inputs_flatten = Flatten()(inputs)
x = Dense(1024, activation='relu')(inputs_flatten)
x = Dense(512, activation='relu')(x)
x = Dense(256, activation='relu')(x)
outputs = Dense(m, activation=None)(x)
model = Model(inputs = inputs, outputs = outputs)
adam = Adam(lr=0.001)
model.compile(optimizer=adam, loss='mse', metrics=['accuracy'])
hist = model.fit(X[:,:,1:], Y, epochs=20, batch_size=10)
# predict third, second and best players for the first game
# the print number, is the player number
Y_pred = model.predict(X[0:1,:,1:])
print(np.argsort(Y_pred.reshape(-1))[-3:])
#[7 29 19]
# True best players fist game
print(np.argsort(Y[0,:].reshape(-1))[-3:])
#[7 29 19]
请注意,对于如此小的数据集(只有 50 个事件,每个游戏一个),此模型架构比建议的更深并且具有更多的节点。
关于tensorflow - 如何在 Python 中运行条件神经网络(类似于 R/Stata 中的 clogit)?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56679166/
是否有一种 STL 算法允许我将一个函数应用于一个范围内的每个元素,转换元素,并将之前转换的元素作为输入? 我在想这样的事情(显然行不通,因为第二个迭代器将无效): struct Input {
我有一个字典列表,例如: l =[{country:'Italy',sales:100,cost:50}{country:'Italy',sales:130,cost:60} {co
考虑以下几点: $var = 'Now is the time' if ($var -like 'Now*') { 'true' } else { 'false' } 输出:真 现在交换 -like
我认为这是一个简单的问题,但尚未得到解决方案。我只想从此处解释的列中获取有效数字。 假设我们有一个包含以下值的 varchar 列 ABC Italy Apple 234.62 2:234:43:22
这个问题已经有答案了: MySQL LIKE IN()? (12 个回答) 已关闭 4 年前。 是否可以使用 IN 子句扩展 LIKE 表达式? 此时我得到以下 SQL: select * from
这个问题在这里已经有了答案: How to postpone/defer the evaluation of f-strings? (14 个答案) 关闭 3 年前。 考虑字符串 string_0
关闭。这个问题需要details or clarity .它目前不接受答案。 想改进这个问题吗? 通过 editing this post 添加细节并澄清问题. 关闭 8 年前。 Improve t
我刚刚阅读了以下关于同一主题的帖子: Facebook like notifications tracking (DB Design)和 Database design to store notifi
我如何在 javascript 中创建一个新事件/像在 c# 中一样? private event EventHandler asdCompleted; private void SetEventHa
我经常访问一个名为 GOOD 的网站我特别喜欢一种审美风格;导航栏如何在网站背景中扩展其颜色。如果您访问该网站,就会明白我的意思。 在 CSS 中,我怎样才能以最简单的方式复制它?我已经用 z-ind
我对 LINQ 比较陌生,不知道如何执行 Like 条件。我有一个 myObject 的 IEnumerable 列表,想要做一些类似 myObject.Description 的事情,比如“Help
我正在尝试在 Sharepoint 2013 提供商托管的应用程序中构建一个类似人员选择器的工具。最初,我使用的是 Utility.ResolvePrincipal,它让我可以访问 Sharepoin
过去几个月我一直在研究微服务架构应用程序,我仍在努力适应分布式特性。我多次注意到一种模式,但我不确定处理它的首选方式是什么。 假设我们有服务 A、服务 B 和服务 C。服务 A 公开了一个 API,其
这个问题在这里已经有了答案: Equivalent to unix "less" command within R console (5 个回答) 6年前关闭。 R 控制台中是否有任何命令与 Linu
是否可以在 Xcode 中为类似于 emacs 中的“标记”功能的行添加书签?还有我可以用来跳转到行号的快捷方式吗?我的源代码变得很长且难以导航。 最佳答案 是的;如果您将文本插入符号放在要添加书签的
在使用 vi 15 年的大部分时间后,我在使用 Go 时一时兴起尝试了 Rob Pike 的 Acme。我真的很喜欢它的小巧轻便。现代 unix 风格的东西在 Acme 中表现不佳,而 Ruby 开发
我正在寻找可以打印矩阵[1:5, 1:5] 的任何包中的函数。 head() 适用于列数较少但矩阵较大的用户。我知道我可以为它创建自己的函数,但我想知道是否已经有函数了。 最佳答案 在名为futile
我正在用 C++ 构建一个聚类算法,但我不能很好地处理 OOP 和发生变化的变量(成员数据)的状态。对于某种复杂的算法,我发现这是我发展的障碍。 因此,我正在考虑将编程语言更改为一种功能语言:Ocam
我有一个这样的日志: Jun 21 06:25:07 172.25.1.1 kernel: DROP IN=ppp0 OUT= MAC= SRC=206.221.177.2 DST=185.79.95
我需要一些帮助来制作类似于 Accordion 的东西。目标是,如果您单击导航中的链接,一个部分会消失,而您单击的部分会出现(在相同位置且不明显)。 如果可能,它还应该自动滚动到该部分的开头(导航的结
我是一名优秀的程序员,十分优秀!