python - 预测 tensorflow 模型

转载作者：行者123 更新时间：2023-11-30 08:54:05

25

4

我是机器学习新手。我正在研究 Iris 数据集。并使用萼片长度、萼片宽度、花瓣长度利用神经网络预测花瓣宽度。因此，将 3 个输入节点作为具有偏差 b1 的 A1，将 10 个隐藏节点作为具有偏差 b2 的 A2 和 1 个输出节点。此外，x_val_train、x_val_test、y_val_train、y_val_test变量用于训练和测试主要功能如下。

x_val = np.array([x[0:3] for x in iris.data])
y_val = np.array([x[3] for x in iris.data])

hidden_layer_size = 10

#Generate a 1D array of random numbers range round(len(x_val)*0.8
train_indices = np.random.choice(len(x_val), round(len(x_val)*0.8), replace = False)

#Create a set which does not contain the numbers in train_indices and turn it into array
test_indices = np.array(list(set(range(len(x_val))) - set(train_indices)))
#print("Train Indexes\n",train_indices,test_indices)

x_val_train = x_val[train_indices]
x_val_test = x_val[test_indices]
y_val_train = y_val[train_indices]
y_val_test = y_val[test_indices]


x_data = tf.placeholder(shape=[None, 3], dtype = tf.float32)
y_target = tf.placeholder(shape = [None, 1], dtype = tf.float32) #Figure out usage of None

#Create Layers for NN

A1 = tf.Variable(tf.random_normal(shape = [3,hidden_layer_size])) #Input -> Hidden
b1 = tf.Variable(tf.random_normal(shape = [hidden_layer_size])) #bias in Input for hidden

A2 = tf.Variable(tf.random_normal(shape = [hidden_layer_size,1])) #Hidden -> Output
b2 = tf.Variable(tf.random_normal(shape=[1])) #Hidden Layer Bias

#Generation of Model

hidden_output = tf.nn.relu(tf.add(tf.matmul(x_data,A1),b1))
final_output = tf.nn.relu(tf.add(tf.matmul(hidden_output,A2),b2))

cost = tf.reduce_mean(tf.square(y_target - final_output))

learning_rate = 0.01

model = tf.train.AdamOptimizer(learning_rate).minimize(cost)

init = tf.global_variables_initializer()

sess.run(init)

#Training Loop

loss_vec = []
test_loss = []
epoch = 500

for i in range(epoch):
    #generates len(x_val_train) random numbers
    rand_index = np.random.choice(len(x_val_train), size = batch_size)
    #Get len(x_val_train) data with its 3 input notes or 
    rand_x = x_val_train[rand_index]
    #print(rand_index,rand_x)
    rand_y = np.transpose([y_val_train[rand_index]])
    sess.run(model, feed_dict = {x_data: rand_x, y_target: rand_y})

    temp_loss = sess.run(cost, feed_dict = {x_data: rand_x, y_target : rand_y})
    loss_vec.append(np.sqrt(temp_loss))

    test_temp_loss = sess.run(cost, feed_dict = {x_data : x_val_test, y_target : np.transpose([y_val_test])})
    test_loss.append(np.sqrt(test_temp_loss))

    if (i+1)%50!=0:
        print('Generation: ' + str(i+1) + '.loss = ' + str(temp_loss))

    predict = tf.argmax(tf.add(tf.matmul(hidden_output,A2),b2), 1)

    test = np.matrix('2  3  4')
    pred = predict.eval(session = sess, feed_dict = {x_data : test})


print("pred: ", pred)

plt.plot(loss_vec, 'k-', label='Train Loss')
plt.plot(test_loss, 'r--', label='Test Loss')
plt.show()

另外，在这段代码中， hidden_output = tf.nn.relu(tf.add(tf.matmul(x_data,A1),b1))`

在标准化我的数据后，我已经成功训练了我的模型。但我需要通过用户输入数据来预测输出。

这里，

test = np.matrix('2  3  4')
pred = predict.eval(session = sess, feed_dict = {x_data : test})

print("pred: ", pred)

我写了这段代码来预测结果，但是 pred 总是返回 0。我也尝试了 100 多个样本，它仍然返回 0。你能告诉我哪里出错了吗？

最佳答案

摘要

我们来看看

predict = tf.argmax(tf.add(tf.matmul(hidden_output,A2),b2), 1)

这(几乎)等于

predict = tf.argmax(final_output)

argmax 是主要问题。如果 final_output 是 1-hot 编码，那么 argmax 就有意义，但 final_output 只是一个标量数组。

完整工作代码

这是完整的工作代码，因为您已经拥有

import numpy as np
import tensorflow as tf

import os
import urllib

# Data sets
IRIS_TRAINING = "iris_training.csv"
IRIS_TRAINING_URL = "http://download.tensorflow.org/data/iris_training.csv"

IRIS_TEST = "iris_test.csv"
IRIS_TEST_URL = "http://download.tensorflow.org/data/iris_test.csv"

# If the training and test sets aren't stored locally, download them.
if not os.path.exists(IRIS_TRAINING):
  raw = urllib.urlopen(IRIS_TRAINING_URL).read()
  with open(IRIS_TRAINING, "w") as f:
    f.write(raw)

if not os.path.exists(IRIS_TEST):
  raw = urllib.urlopen(IRIS_TEST_URL).read()
  with open(IRIS_TEST, "w") as f:
    f.write(raw)

training_set = tf.contrib.learn.datasets.base.load_csv_with_header( filename=IRIS_TRAINING, target_dtype=np.int, features_dtype=np.float32)
test_set = tf.contrib.learn.datasets.base.load_csv_with_header( filename=IRIS_TEST, target_dtype=np.int, features_dtype=np.float32)

x_val_train = training_set.data[:,:3]
x_val_test = test_set.data[:,:3]
y_val_train = training_set.data[:,3].reshape([-1,1])
y_val_test = test_set.data[:,3].reshape([-1,1])

x_data = tf.placeholder(shape=[None, 3], dtype = tf.float32)
y_target = tf.placeholder(shape = [None, 1], dtype = tf.float32) #Figure out usage of None

#Create Layers for NN
hidden_layer_size = 20

A1 = tf.Variable(tf.random_normal(shape = [3,hidden_layer_size])) #Input -> Hidden
b1 = tf.Variable(tf.random_normal(shape = [hidden_layer_size])) #bias in Input for hidden

A2 = tf.Variable(tf.random_normal(shape = [hidden_layer_size,1])) #Hidden -> Output
b2 = tf.Variable(tf.random_normal(shape = [1])) #Hidden Layer Bias

#Generation of model

hidden_output = tf.nn.relu(tf.add(tf.matmul(x_data,A1),b1))
final_output = tf.add(tf.matmul(hidden_output,A2),b2)

loss = tf.reduce_mean(tf.square(y_target - final_output))

learning_rate = 0.01
train = tf.train.AdamOptimizer(learning_rate).minimize(loss)

init = tf.global_variables_initializer()
sess = tf.Session()
sess.run(init)

#Training Loop

loss_vec = []
test_loss = []
epoch = 2000
batch_size = 100


def oneTrainingSession(epoch,loss_vec,test_loss,batch_size) :
    rand_index = np.random.choice(len(x_val_train), size = batch_size)

    rand_x = x_val_train #[rand_index,:]
    rand_y = y_val_train #[rand_index,:]

    temp_loss,_ = sess.run([loss,train], feed_dict = {x_data: rand_x, y_target : rand_y})
    loss_vec.append(np.sqrt(temp_loss))

    test_temp_loss = sess.run(loss, feed_dict = {x_data : x_val_test, y_target : y_val_test})
    test_loss.append(np.sqrt(test_temp_loss))

    if (i+1)%500 == 0:
        print('Generation: ' + str(i+1) + '.loss = ' + str(temp_loss))

for i in range(epoch):
    oneTrainingSession(epoch,loss_vec,test_loss,batch_size)

test = x_val_test[:3,:]
print "The test values are"
print test
print ""
pred = sess.run(final_output, feed_dict = {x_data : test})
print("pred: ", pred)

输出

Generation: 500.loss = 0.12768
Generation: 1000.loss = 0.0389756
Generation: 1500.loss = 0.0370268
Generation: 2000.loss = 0.0361797
The test values are
[[ 5.9000001   3.          4.19999981]
 [ 6.9000001   3.0999999   5.4000001 ]
 [ 5.0999999   3.29999995  1.70000005]]

('pred: ', array([[ 1.45187187],
       [ 1.92516518],
       [ 0.36887735]], dtype=float32))

关于python - 预测 tensorflow 模型，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/44638697/

25

4

0

文章推荐： python - 值错误: invalid fill value with a

文章推荐： python-3.x - 发现输入变量样本数量不一致: [100, 300]

文章推荐： java - 斯坦福 NLP 注释文本非常慢

R 预测 - 如何仅绘制子集？
我正在使用 R 预测包拟合模型，如下所示: fit <- auto.arima(df) plot(forecast(fit,h=200)) 打印原始数据框和预测。当 df 相当大时，这
r - 预测-回归的神经网络预测相同的值
我正在尝试预测自有住房的中位数，这是一个行之有效的例子，给出了很好的结果。 https://heuristically.wordpress.com/2011/11/17/using-neural-ne
r - 预测()函数的类型参数
type="class"函数中的type="response"和predict有什么区别？例如： predict(modelName, newdata=testData, type = "class
python - 如何以图像的形式保存CNN模型的输出(预测)？
我有一个名为 Downloaded 的文件夹，其中包含经过训练的 CNN 模型必须对其进行预测的图像。下面是导入图片的代码: import os images = [] for filename i
区间内的 R 预测
关于预测的快速问题。我尝试预测的值是 0 或 1(它设置为数字，而不是因子)，因此当我运行随机森林时: fit , data=trainData, ntree=50) 并预测: pred, data
python - 预测，(找到正确的模型)
使用 Python，我尝试使用历史销售数据来预测产品的 future 销售数量。我还试图预测各组产品的这些计数。例如，我的专栏如下所示: Date Sales_count Department It
R SVM 预测
我是 R 新手，所以请帮助我了解问题所在。我试图预测一些数据，但预测函数返回的对象(这是奇怪的类(因子))包含低数据。测试集大小为 5886 obs。 160 个变量，当预测对象长度为 110 时..
java - 预测/识别电话号码的国家代码
关闭。这个问题需要更多focused .它目前不接受答案。想改进这个问题吗？更新问题，使其只关注一个问题 editing this post . 关闭 6 年前。 Improve this qu
python - 您如何从训练有素的网络对给定输入进行预测(预测)？
下面是我的神经网络代码，有 3 个输入和 1 个隐藏层和 1 个输出: #Data ds = SupervisedDataSet(3,1) myfile = open('my_file.csv','r
php - 预测/纠正全文搜索
我正在开发一个 Web 应用程序，它具有全文搜索功能，可以正常运行。我想对此进行改进并向其添加预测/更正功能，这意味着如果用户输入错误或结果为 0，则会查询该输入的更正版本，而不是查询结果。基本上类似
python - 具有单一分类特征的 LSTM 预测
我对时间序列还很陌生。这是我正在处理的数据集: Date Price Location 0 2012-01-01 1771.0
sequence - 如何使用隐马尔可夫模型进行 future 预测
我有许多可变长度的序列。对于这些，我想训练一个隐马尔可夫模型，稍后我想用它来预测(部分)序列的可能延续。到目前为止，我已经找到了两种使用 HMM 预测 future 的方法: 1) 幻觉延续并获得该延
映射到标签的 Tensorflow Serving 预测
我正在使用 TensorFlow 服务提供初始模型。我在 Azure Kubernetes 上这样做，所以不是通过更标准和有据可查的谷歌云。无论如何，这一切都在起作用，但是我感到困惑的是预测作为浮点
r - AWS 预测。项目数量的观察值太少
我正在尝试使用 Amazon Forecast 进行一些测试。我现在尝试了两个不同的数据集，它们看起来像这样: 13,2013-03-31 19:25:00,93.10999 14,2013-03-3
python - 预测 ufunc 输出的内存布局
使用 numpy ndarray大多数时候我们不需要担心内存布局的问题，因为结果并不依赖于它。除非他们这样做。例如，考虑这种设置 3x2 矩阵对角线的稍微过度设计的方法 >>> a = np.zer
R:如何在同一时间序列上绘制多个 ARIMA 预测
我想在同一个地 block 上用不同颜色绘制多个预测，但是，比例尺不对。我对任何其他方法持开放态度。可重现的例子: require(forecast) # MAKING DATA data
r - 通过分类变量和连续变量的交互可视化 GLMM 预测
我正在 R 中使用 GLMM，其中混合了连续变量和 calcategories 变量，并具有一些交互作用。我使用 MuMIn 中的 dredge 和 model.avg 函数来获取每个变量的效果估计。
output - 在命令行中导出 Weka 预测
我能够在 GUI 中成功导出分类器错误，但无法在命令行中执行此操作。有什么办法可以在命令行上完成此操作吗？我使用的是 Weka 3.6.x。在这里，您可以右键单击模型，选择“可视化分类器错误”并从那
R:如何在同一时间序列上绘制多个 ARIMA 预测
我想在同一个地 block 上用不同颜色绘制多个预测，但是，比例尺不对。我对任何其他方法持开放态度。可重现的例子: require(forecast) # MAKING DATA data
r - 预测 R 中的内存使用情况
我从 UCI 机器学习数据集库下载了一个巨大的文件。 (~300mb)。有没有办法在将数据集加载到 R 内存之前预测加载数据集所需的内存？ Google 搜索了很多，但我到处都能找到如何使用 R-p

首页

博学

6Ren·AI

商城

python - 预测 tensorflow 模型

摘要

完整工作代码

输出