gpt4 book ai didi

python - Keras 预测一个数字,如果在一个范围内则通过

转载 作者:太空宇宙 更新时间:2023-11-03 11:14:46 24 4
gpt4 key购买 nike

我的纪元和运行的准确性有问题。准确性无处不在,这与我想估计一个数字这一事实有关。如果估计量为 +/- 2% 或其他值,我希望测试通过。

代码:

seed = 7
basepath = '.'

# find the right path for batch ai vs local
outpath = os.path.join (basepath, "out")
if not os.path.exists(outpath):
os.makedirs(outpath)

# Importing the dataset
dataset = pd.read_csv(os.path.join (basepath, 'data.csv'))

# fix random seed for reproducibility
np.random.seed(seed)

#Encode columns using label encoding
#use a new label encoder everytime is important!
vixpercentencoder = LabelEncoder()
dataset['VIX Open Percent'] = responsetimeencoder.fit_transform(dataset['VIX Open Percent'])

fiftydayaverageencoder = LabelEncoder()
dataset['50 day average'] = suppliesgroupencoder.fit_transform(dataset['50 day average'])

twohundreddayaverageencoder = LabelEncoder()
dataset['200 day average'] = suppliessubgroupencoder.fit_transform(dataset['200 day average'])

openingencoder = LabelEncoder()
dataset['opening'] = regionencoder.fit_transform(dataset['opening'])

#routetomarketencoder = LabelEncoder()
#dataset['Route To Market'] = routetomarketencoder.fit_transform(dataset['Route To Market'])

#What are the correlations between columns and target
correlations = dataset.corr()['closing'].sort_values()

#Throw out unneeded columns
dataset = dataset.drop('Date', axis=1)
dataset = dataset.drop('VIX Open', axis=1)
dataset = dataset.drop('VIX Close', axis=1)
dataset = dataset.drop('Ticker', axis=1)
#dataset = dataset.drop('VIX Open Percent', axis=1)

#One Hot Encode columns that are more than binary
# avoid the dummy variable trap
#dataset = pd.concat([pd.get_dummies(dataset['Route To Market'], prefix='Route To Market', drop_first=True),dataset], axis=1)
#dataset = dataset.drop('Route To Market', axis=1)

#Create the input data set (X) and the outcome (y)
X = dataset.drop('closing', axis=1).iloc[:, 0:dataset.shape[1] - 1].values
y = dataset.iloc[:, dataset.columns.get_loc('closing')].values

# Feature Scaling
sc = StandardScaler()
X = sc.fit_transform(X)

# Initilzing the ANN
model = Sequential()

#Adding the input layer
model.add(Dense(units = 8, activation = 'relu', input_dim=X.shape[1], name= 'Input_Layer'))

#Add hidden layer
model.add(Dense(units = 8, activation = 'relu', name= 'Hidden_Layer_1'))

#Add the output layer
model.add(Dense(units = 1, activation = 'sigmoid', name= 'Output_Layer'))

# compiling the ANN
model.compile(optimizer= 'nadam', loss = 'binary_crossentropy', metrics=['accuracy'])

# summary to console
print (model.summary())

#Fit the ANN to the training set
history = model.fit(X, y, validation_split = .20, batch_size = 64, epochs = 25)

# summarize history for accuracy
plt.plot(history.history['acc'])
plt.plot(history.history['val_acc'])
plt.title('model accuracy')
plt.ylabel('accuracy')
plt.xlabel('epoch')
plt.legend(['train', 'test'], loc='upper left')
plt.show()

# summarize history for loss
plt.plot(history.history['loss'])
plt.plot(history.history['val_loss'])
plt.title('model loss')
plt.ylabel('loss')
plt.xlabel('epoch')
plt.legend(['train', 'test'], loc='upper left')
plt.show()

最佳答案

您似乎在尝试预测连续值(即回归问题)而不是离散值(即分类问题)。因此,我建议如下:

  1. 使用 sigmoid 作为最后一层的激活函数在这里是不合适的,除非目标值严格在 [0,1] 范围内。相反,如果值是无界的,则不要对最后一层使用任何激活(即 linear 激活)。

  2. 使用适当的回归损失函数,例如均方误差,即 'mse'

  3. 使用 'accuracy' 作为度量在回归任务中没有意义(即它仅用于分类问题)。相反,如果您想要一个指标来监控训练,请使用另一个指标,例如平均绝对误差,即 'mae'

正确设置模型需要遵循上述内容。然后,开始试验和调整模型的循环。您可以尝试不同的层、不同数量的层或层中的单元、添加正则化等,直到找到性能良好的模型。当然,您可能还需要有一个验证集,以便您可以比较不同配置在一组固定的未见样本上的性能。

最后一点,不要指望这里的任何人都能为您提供完整的“致胜解决方案”。你需要自己用你拥有的数据进行实验,因为在机器学习中,为某些特定数据和特定任务设计合适的模型是艺术、科学和经验的结合。最后,其他人能给你的只是一些指点或想法(当然,除了提到你的错误)。

关于python - Keras 预测一个数字,如果在一个范围内则通过,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53939290/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com