python - 让 TensorFlow 做一些琐碎的事情时遇到困难-6ren

python - 让 TensorFlow 做一些琐碎的事情时遇到困难

转载作者：太空宇宙更新时间：2023-11-03 21:20:12

我有一个向量 x 并想要计算向量 y 使得 y[j] = x[j]**2使用下面由 TensorFlow 指定的神经网络。效果不太好，错误率很高。
我做错了什么吗？
任何帮助将不胜感激

它的工作方式是首先在 Xtrain、Ytrain、Xtest 和 Ytest 中生成数据，然后创建占位符变量以使 TensorFlow 运行。
然后它指定三个隐藏层和一个输出层。然后进行训练，并使用 feed 字典创建 Ypred(Ytest 的预测)。

import numpy as np
import tensorflow as tf

n = 10
k = 1000
n_hidden = 10
learning_rate = .01
training_epochs = 100000

Xtrain = []
Ytrain = []
Xtest = []
Ytest = []

for i in range(0,k,1):
    X = np.random.randn(1,n)[0]
    Xtrain += [X]
    Ytrain += [Xtrain[-1]**2]
    X = np.random.randn(1,n)[0]
    Xtest += [X]
    Ytest += [Xtest[-1]**2]

x = tf.placeholder(tf.float64,shape = (k,n))
y = tf.placeholder(tf.float64,shape = (k,n))

W1 = tf.Variable(tf.random_normal((n,n_hidden),dtype = tf.float64))
b1 = tf.Variable(tf.random_normal((n_hidden,),dtype = tf.float64))
x_hidden1 = tf.nn.sigmoid(tf.matmul(x,W1) + b1)

W2 = tf.Variable(tf.random_normal((n,n_hidden),dtype = tf.float64))
b2 = tf.Variable(tf.random_normal((n_hidden,),dtype = tf.float64))
x_hidden2 = tf.nn.sigmoid(tf.matmul(x_hidden1,W2) + b2)

W3 = tf.Variable(tf.random_normal((n,n_hidden),dtype = tf.float64))
b3 = tf.Variable(tf.random_normal((n_hidden,),dtype = tf.float64))
x_hidden3 = tf.nn.sigmoid(tf.matmul(x_hidden1,W3) + b3)

W4 = tf.Variable(tf.random_normal((n,n_hidden),dtype = tf.float64))
b4 = tf.Variable(tf.random_normal((n_hidden,),dtype = tf.float64))
y_pred = tf.matmul(x_hidden3,W4) + b4

penalty = tf.reduce_sum(tf.abs((y - y_pred)))
train_op = tf.train.AdamOptimizer(learning_rate).minimize(penalty)

model = tf.global_variables_initializer()
with tf.Session() as sess:
    sess.run(model)
    for i in range(0,training_epochs):
        sess.run(train_op,{x: Xtrain,y: Ytrain})

    Ypred = y_pred.eval(feed_dict = {x: Xtest})

最佳答案

这只是对代码的一些简单修改:

import numpy as np
import tensorflow as tf

n = 10
k = 1000
learning_rate = 1e-3
training_epochs = 100000

# It will be better for you to use PEP8 style

# None here will allow you to feed data with ANY k size
x = tf.placeholder(tf.float64, shape=(None, n))
y = tf.placeholder(tf.float64, shape=(None, n))

# Use default layer constructors
# from your implementation it uses another random initializer
out = tf.layers.dense(x, 100)
out = tf.layers.batch_normalization(out)
# ReLU is better than sigmoid, there are a lot of articles about it
out = tf.nn.relu(out)

out = tf.layers.dense(out, 200)
out = tf.layers.batch_normalization(out)
out = tf.nn.relu(out)

out = tf.layers.dense(out, n)

# total loss = mean L1 for samples
# each sample is a vector of 10 values, so you need to calculate
# sum along first axis, and them calculate mean of sums
l1 = tf.reduce_mean(tf.reduce_sum(tf.abs(y - out), axis=1))
train_op = tf.train.AdamOptimizer(learning_rate).minimize(l1)

model = tf.global_variables_initializer()
with tf.Session() as sess:
    sess.run(model)
    for i in range(training_epochs):
        xs = np.random.randn(k, n)
        ys = xs ** 2
        _, l1_value = sess.run(
            [train_op, l1],
            feed_dict={x: xs, y: ys})
        if (i + 1) % 10000 == 0 or i == 0:
            print('Current l1({}/{}) = {}'.format(
                i + 1, training_epochs, l1_value))

    xs = np.random.randn(k, n)
    ys = xs ** 2
    test_l1 = sess.run(l1, feed_dict={x: xs, y: ys})
    print ('Total l1 at test = {}'.format(test_l1))

输出:

Current l1(1/100000) = 11.0853215657
Current l1(10000/100000) = 0.126037403282
Current l1(20000/100000) = 0.096445475666
Current l1(30000/100000) = 0.0719392853473
Current l1(40000/100000) = 0.0690671103719
Current l1(50000/100000) = 0.07661241544
Current l1(60000/100000) = 0.0743827124406
Current l1(70000/100000) = 0.0656016587469
Current l1(80000/100000) = 0.0675546809828
Current l1(90000/100000) = 0.0649035400487
Current l1(100000/100000) = 0.0583308788607
Total l1 at test = 0.0613149096968

可以使用其他架构、学习率、批量大小、纪元计数、损失函数等来增强总惩罚

看来架构可能会增加，那么你就可以长时间训练，得到1e-3了。

有关其工作原理和操作方法的更多信息，请访问 CS231 course .

附注这是关于数据馈送的一些假设:我测试的一些数据可能是在训练过程中。因为任务很简单，所以可以，但最好保证测试集中没有任何训练样本。

关于python - 让 TensorFlow 做一些琐碎的事情时遇到困难，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/54347723/

文章推荐： python - Python 中的验证性因素分析

文章推荐： c# - 如何使用秒表测量 while 循环迭代平均值

文章推荐： javascript - 在图像上悬停显示图像上的div

文章推荐：具有多个 where 子句和多个 id 字段的 C# Sql Server 更新

c# - 以正确的方式做 DRY 事情
我有一个包含两个项目的解决方案，每个项目都生成一个单独的 dll，供另一个 Windows 应用程序使用。这些项目中的每一个都有一个名为 MyActions 的类，只有一个这样的方法项目 1
c# - 以正确的方式做 DRY 事情
我有一个包含两个项目的解决方案，每个项目都生成一个单独的 dll，供另一个 Windows 应用程序使用。这些项目中的每一个都有一个名为 MyActions 的类，只有一个这样的方法项目 1
javascript - 一个奇怪的 moment.js 事情
所以我在 if 语句中有这段代码如下 if (!inTime || !moment(inTime).format('m') % 15 === 0) { doSomething(); } 传入的 inT
javascript - 我想做的一件棘手的 javascript 事情...从列表中提取元素并隐藏其余部分
像往常一样，我想做的比我知道的还多:-D 这就是我正在做的事情......我正在写一篇简历。但是在简介中，我想要一个“长简介”和一个“短简介”按钮。长传记显然会显示整个传记，但短传记会捕获列表中的
javascript - 事情。 js 检查 body 是否停止移动
我正在使用物质。 js创建一个二维场景。我在场景中对一个物体施加力，这个物体撞击其他物体，但最终所有物体都因摩擦和能量损失而停止移动。我需要以某种方式检测场景中的所有物体何时停止移动。我发现这样
javascript - 帮助 ajax jquery css 事情
谁能快速浏览一下这段代码，让我知道哪里出错了。在模糊事件中，.textok 类加载正常，但 .textbad 类加载不正常。 .textok { color:#0F0; background
java - 如何让 Gradle 完成一个简单的 makefile 事情
我的情况是这样的:我有一个项目，它使用了一些生成的代码。在生成的代码中，几乎所有文件中都硬编码了某个 URI。因此，在某些时候我得到了两个生成的代码库:一个针对开发，另一个针对暂存。我想通过 Gr
java - Web 应用程序开发人员应该注意哪些对 SEO 不友好的 Java 事情？
这是一个严肃的问题(见我的评论)。问题很简单:Java 所做的所有 SEO 不友好的事情有哪些会导致您的网站在主要搜索引擎中的排名不如应有的好？最佳答案有一个与 JSESSIONID 相关的 s
javascript - 在一些 jquery ajax 之后如何做其他 jquery 事情
我正在使用 PHP。我想完成 jQuery AJAX 进程，(完成进程并数据返回主页后)。然后执行下一个 jQuery 操作。关于如何做到这一点有什么想法吗？ $.ajax({ url: "pa
c++ - 如果我在 _mm_clflushopt() 之后不发出 _mm_sfence() 会发生什么(不好的)事情？
在释放内存之前，我要从 CPU 缓存中逐出内存范围。理想情况下，我只想放弃这些缓存行而不将它们保存到内存中。因为没有人会使用这些值，无论谁再次获得该内存范围(在 malloc()/new/_mm_ma
json - 使用 @ResponseBody 自定义 HttpMessageConverter 来做 Json 事情
我不喜欢 jackson 。我想使用 ajax，但要使用 Google Gson。所以我试图弄清楚如何实现我自己的 HttpMessageConverter 以将其与 @ResponseBody

太空宇宙

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

python - 让 TensorFlow 做一些琐碎的事情时遇到困难