gpt4 book ai didi

machine-learning - 如何使用 RGB 图像训练 CNN

转载 作者:行者123 更新时间:2023-11-30 08:52:19 24 4
gpt4 key购买 nike

我目前正在构建一个 CNN 来区分烂苹果和正常苹果。我觉得如果我能向 CNN 提供 RGB 图像,那将会有很大的好处。但是,对于以下网络我到底需要更改什么?

 x = tf.placeholder('float', [None, 784])
#y = tf.placeholder(tf.float32, shape=(), name="init")
y = tf.placeholder('int32')

keep_rate = 0.8
keep_prob = tf.placeholder(tf.float32)

def conv2d(x, W):
return tf.nn.conv2d(x, W, strides=[1,1,1,1], padding='SAME')

def maxpool2d(x):
# size of window movement of window
return tf.nn.max_pool(x, ksize=[1,2,2,1], strides=[1,2,2,1], padding='SAME')



def convolutional_neural_network(x):
weights = {'W_conv1':tf.Variable(tf.random_normal([5,5,1,32])),
'W_conv2':tf.Variable(tf.random_normal([5,5,32,64])),
'W_fc':tf.Variable(tf.random_normal([7*7*64,1024])),
'out':tf.Variable(tf.random_normal([1024, n_classes]))}

biases = {'b_conv1':tf.Variable(tf.random_normal([32])),
'b_conv2':tf.Variable(tf.random_normal([64])),
'b_fc':tf.Variable(tf.random_normal([1024])),
'out':tf.Variable(tf.random_normal([n_classes]))}

x = tf.reshape(x, shape=[-1, 28, 28, 1])

print("test")
print(x)
conv1 = tf.nn.relu(conv2d(x, weights['W_conv1']) + biases['b_conv1'])
conv1 = maxpool2d(conv1)

conv2 = tf.nn.relu(conv2d(conv1, weights['W_conv2']) + biases['b_conv2'])
conv2 = maxpool2d(conv2)

fc = tf.reshape(conv2,[-1, 7*7*64])
fc = tf.nn.relu(tf.matmul(fc, weights['W_fc'])+biases['b_fc'])
fc = tf.nn.dropout(fc, keep_rate)

output = tf.matmul(fc, weights['out'])+biases['out']
return output

我尝试更改某些值,但是我不断收到一个又一个错误。该网络当前旨在拍摄 28 x 28 channel 1 灰度图像。

最佳答案

灰度图像和 RGB 图像之间的唯一区别是波段数,分别为 1 和 3。

因此,您的 CNN 必须采用 3 个频段作为输入,而不是 1 个。其余部分将被处理。

在不运行代码的情况下,您至少需要更改:

weights = {'W_conv1':tf.Variable(tf.random_normal([5,5,3,32]))
x = tf.reshape(x, shape=[-1, 28, 28, 3])

关于machine-learning - 如何使用 RGB 图像训练 CNN,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42334674/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com