gpt4 book ai didi

machine-learning - Google Cloud ML 在训练时以非零状态 245 退出

转载 作者:行者123 更新时间:2023-11-30 09:19:56 25 4
gpt4 key购买 nike

我尝试使用以下示例代码在 Google Cloud ML 上训练我的模型:

import keras
from keras import optimizers
from keras import losses
from keras import metrics
from keras.models import Model, Sequential
from keras.layers import Dense, Lambda, RepeatVector, TimeDistributed
import numpy as np

def test():
model = Sequential()
model.add(Dense(2, input_shape=(3,)))
model.add(RepeatVector(3))
model.add(TimeDistributed(Dense(3)))
model.compile(loss=losses.MSE,
optimizer=optimizers.RMSprop(lr=0.0001),
metrics=[metrics.categorical_accuracy],
sample_weight_mode='temporal')
x = np.random.random((1, 3))
y = np.random.random((1, 3, 3))
model.train_on_batch(x, y)

if __name__ == '__main__':
test()

我得到了这个错误:

The replica master 0 exited with a non-zero status of 245. Termination reason: Error.

详细的错误输出很大,所以我粘贴它 here in pastebin

最佳答案

请注意此输出:

Module raised an exception for failing to call a subprocess Command '['python', '-m', u'trainer.test', '--job-dir', u'gs://my_test_bucket_keras/s_27_100630']' returned non-zero exit status -11.

我猜谷歌云将使用一个名为 --job-dir 的额外参数来运行您的代码。那么也许您可以尝试在示例代码中添加以下代码?

import ...
import argparse

def test():
model = Sequential()
model.add(Dense(2, input_shape=(3,)))
model.add(RepeatVector(3))
model.add(TimeDistributed(Dense(3)))
model.compile(loss=losses.MSE,
optimizer=optimizers.RMSprop(lr=0.0001),
metrics=[metrics.categorical_accuracy],
sample_weight_mode='temporal')
x = np.random.random((1, 3))
y = np.random.random((1, 3, 3))
model.train_on_batch(x, y)

if __name__ == '__main__':
parser = argparse.ArgumentParser()
# Input Arguments
parser.add_argument(
'--job-dir',
help='GCS location to write checkpoints and export models',
required=True
)
args = parser.parse_args()
arguments = args.__dict__

test()
# test(**arguments) # or if you want to use this job_dir parameter in your code

不能 100% 确定这会起作用,但我认为你可以尝试一下。我还有一个post here要做类似的事情,也许你也可以看看那里。

关于machine-learning - Google Cloud ML 在训练时以非零状态 245 退出,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43651296/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com