python - 如何在 GPU 中的 Tensorflow 上并行运行独立循环-6ren

python - 如何在 GPU 中的 Tensorflow 上并行运行独立循环

转载作者：太空宇宙更新时间：2023-11-04 04:56:24

28

4

我想通过模拟实现重建受限玻尔兹曼机的算法。 M 是可见变量的数量，N 是隐藏变量的数量。为了在GPU上并行运行，我想先用python写在tensorflow上。

在我的主函数 RBMIC() 中，我需要使用 L1 惩罚运行 M 个独立逻辑回归并更新我的权重和偏置矩阵:(w 和 b)，然后稍后使用它们估算隐藏变量的值.所以我写了一个独立的for循环。我想知道 tensorflow 是否可以识别独立的 for 循环并在 GPU 上高效地运行它(每个内核进行一次迭代)？
代码也非常慢，特别是对于运行逻辑回归，因为它需要运行 epochs=1000 次以最小化损失函数。但是我发现如果我使用 sklearn.linear_model.LogisticRegression 会非常快。为什么会有这么大的差异？但是为了用GPU，还是想用tensorflow来写logistic regression。谁能给我一些关于如何更有效地编写它的建议？
当我编写逻辑回归函数:LogisticsReg() 时，我需要获取权重和偏差，并且还需要将它们作为 tensorflow 变量保存以供我进一步计算。但是根据我的函数:LogisticsReg()，它在 sess.run() 之后返回非张量变量。所以我再次将它们转换为张量变量。这部分合理吗？或者是否有任何有效的方法将其保存在张量变量中，然后可用于更新权重和偏置矩阵(w 和 b)？感谢您的建议!

我对 tensorflow 和 python 很陌生。抱歉打扰了，感谢您的宝贵时间!!

import numpy as np
import tensorflow as tf


n = 200
M = 4
N = 2
mu, sigma = 0, 0.1
beta = 0.001
lr=0.05
epochs = 1000
Maxepochs = 10
iteration = 100


visible = np.array([[1,0,1,0],[0,1,1,0],[1,0,0,1],[0,1,0,1]])
vis = np.tile(visible,50).reshape(n,M)
vis = tf.cast(vis, tf.float32)
err_hat = np.zeros([iteration])


def Bionimal(x):
    sample = tf.where(tf.random_uniform(shape=x.shape) - x < 0,
                      tf.ones(shape=x.shape), tf.zeros(shape=x.shape))
    return sample

def LogisticsReg(X, Y, wj, bj, beta, lr, epochs):
    logitj = tf.add(tf.matmul(X, wj), bj)
    loss = tf.reduce_mean(tf.nn.sigmoid_cross_entropy_with_logits(labels=Y, logits=logitj))
    l1_regularizer = tf.reduce_sum(tf.abs(wj))
    loss = tf.reduce_mean(loss + beta * l1_regularizer)
    optimizer = tf.train.GradientDescentOptimizer(learning_rate=lr).minimize(loss, var_list=[wj, bj])
    with tf.Session() as sess:
        tf.global_variables_initializer().run()
        for k in range(epochs):  # train the model n_epochs times
            _, bf, wf = sess.run([optimizer, bj, wj])
    # bf = tf.Variable(bf,name="bf")
    # wf = tf.Variable(wf,name="wf")
    return [bf, wf]

def UpdateC(wi, hi, c_opt, Maxepochs):
    ph = tf.sigmoid(tf.add(tf.matmul(vis, tf.transpose(wi)), c_opt))
    lik = tf.add(tf.multiply(hi, tf.log(ph)), tf.multiply((1. - hi), tf.log(1. - ph)))
    loss2 = -tf.reduce_sum(lik)
    optimizer = tf.contrib.opt.ScipyOptimizerInterface(loss2, var_to_bounds={c_opt: (-1,1)},options={'maxiter': Maxepochs}, var_list=[c_opt])
    with tf.Session() as sess:
        tf.global_variables_initializer().run()
        optimizer.minimize(sess)
        return sess.run(c_opt)



# initial
w = tf.Variable(tf.random_normal(shape=(N, M), stddev=0.1), name="weights")
c = tf.Variable(tf.random_normal(shape=(1, N), stddev=0.1), name="hbias")
b = tf.Variable(tf.random_normal(shape=(1, M), stddev=0.1), name="vbias")


def RBMIC(w,c,vis):
    # calculate hidden variables
    logits = tf.add(tf.matmul(vis, tf.transpose(w)), tf.tile(c, [n, 1]))
    prob = tf.sigmoid(logits)
    hids = Bionimal(prob)
    # estimate bias, weight by logistics regression with l1 penalty and also bias c for visible variables.
    bs = np.zeros([1, M])
    ws = np.zeros([N, M])
    X = hids
    for j in range(M):
        Y = tf.reshape(vis[:, j], [n, 1])
        wj = tf.Variable(tf.reshape(w[:, j], [N, 1]), name="wj")
        bj = tf.Variable(tf.random_normal(shape=[1, 1], stddev=0.1), name="bj")
        bf, wf = LogisticsReg(X, Y, wj, bj, beta, lr, epochs)
        bs[0, j] = bf
        ws[:, [j]] = wf
    b = tf.cast(tf.Variable(bs, name="vbias"), tf.float32)
    w = tf.cast(tf.Variable(ws, name="weights"), tf.float32)
    cs = np.zeros([1, N])
    for i in range(N):
        wi = tf.reshape(w[i, :], [1, M])
        hi = tf.reshape(hids[:, i], [n, 1])
        c_opt = tf.Variable(c[0, i], name="c_opt")
        cs[0, i] = UpdateC(wi, hi, c_opt, Maxepochs)
    c = tf.cast(tf.Variable(cs, name="hbias"), tf.float32)
    # evaluate performance
    vis_pred = tf.sigmoid(tf.add(tf.matmul(hids, w), tf.tile(b, [n, 1])))
    err = tf.reduce_sum((vis_pred - vis) ** 2)
    return err



for step in range(iteration):  # train the model iteration times
        err = RBMIC(w,c,vis)
        init = tf.global_variables_initializer()
        sess = tf.Session()
        sess.run(init)
        print 'reconstruct at step %d = \n' % (step)
        print sess.run(err)

最佳答案

为了回答您帖子标题中的问题，控制流构造 tf.while_loop支持并行执行迭代(通过关键字参数 parallel_iterations 公开)。

关于您的第二个和第三个问题，您可能不想创建多个 session 。例如，如果您使用单个 session ，则不必将张量转换为变量。我强烈建议您查阅教程和文档以获取有关 TensorFlow 语义的更多信息 graphs and sessions .

关于python - 如何在 GPU 中的 Tensorflow 上并行运行独立循环，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/46962213/

28

4

0

文章推荐： python Pandas : how to take only the earliest date in each group

文章推荐： linux - Ansible 执行脚本不起作用

文章推荐：计算 CFStringRef/CFMutableArrayRef 使用的字节数

文章推荐： linux - random() 在 Linux 中函数相同的值(同时 grof ing)

独立；获取方法的参数
我如何使用 CQLINQ 获取当前方法的输入参数集合？有像“参数”或“参数”这样的集合，只有“NbParamenter”不适合我的目的。最佳答案事实上，CQLinq 还没有这个功能。但是，在许多情
makefile 独立@符号和目录关键字
我想知道是否有人知道我的 makefile 中独立的 @ 符号和“dir”命令在这里(第二行和第三行)的作用: $(BUILD)/%.o: %.cpp @mkdir -p $(dir $@)
makefile 独立@符号和目录关键字
我想知道是否有人知道我的 makefile 中独立的 @ 符号和“dir”命令在这里(第二行和第三行)的作用: $(BUILD)/%.o: %.cpp @mkdir -p $(dir $@)
java - Spark 独立
我的机器上有带有 4 个 cpu 的 Ubuntu 14.04(nproc 恢复了 4 个)。我安装并执行 Spark Standalone 后(本地)，我可以自己定义不同数量的奴隶。例如我想要有4个
C# 独立 WebDAV
我看到所有这些 iPhone 应用程序都带有内置的独立 webDav 服务器。是否有可以集成到现有应用程序中的独立(如在其自己的 IIS 中)C# webDAV 项目。最佳答案至少有两个用于 .N
django - 独立 Django 应用程序中的迁移
我如何在独立的 Django 应用程序上进行迁移(即不属于任何项目的应用程序)。例如在以下之后:https://docs.djangoproject.com/en/1.8/intro/reusabl
svn - 独立 SVN 查看器
我目前正在使用 tortoiseSVN 对本地编程文件进行版本控制。我不运行 SVN 服务器，因为可以直接使用 tortoiseSVN(例如 http://invalidlogic.com/2006/
javascript - 如何在Bootstrap中为*独立*几个进度条部分设置动画？
我有一些 Bootstrap 代码，当用户查看它时，它可以很好地为进度条部分设置动画。然而它动画全部页面中的进度条而不是动画仅限该查看部分中的进度条。结果，当用户转到进度条的另一部分时，这些已
iOS 独立 PWA 输入捕获
我认为我们在 iOS 13.2/13.3 中发现了关于在独立模式下运行的 PWA 的回归。由于在 iOS PWA 上无法访问 getUserMedia() 我们依赖 capture HTML5 输入
excel - 独立 Excel 宏
我有一个每周从系统运行一次的报告，并将数据导出到 Excel 文档中。我已经设置了将数据导出到 Excel 的工具，以便在格式化方面做得很好，但是一旦数据进入 Excel，我还需要做更多的事情。是否
java - 独立(并行)替换字符串中的一组子字符串
//值数组的格式为 { "var1", "val1", "var2", "val2",.. } public static String replaceMethod(String template,
java - 独立 jar 滞后
当我在 eclipse 中运行我的项目时，它工作正常，当我将它导出为独立 jar 时，它会滞后。我使用相同的 vmargs，在 Eclipse 中尝试了 3 种不同的导出设置，似乎没有任何帮助最佳答
java - 独立 Java 程序中的注释基础配置
我了解到 Java EE 中我非常喜欢的注释基础配置(@Resource)功能。然后我注意到注释实际上是 Java SE 的一部分。所以我想知道是否可以将它与 Java SE 一起使用。我当然可以在
java - jpa + hibernate + 独立
我无法理解为什么这种关系没有被持久化，并且程序不会正常退出，但在 Eclipse 中继续运行。下面是我的代码，排除了包名: 主要: import java.io.BufferedInputStrea
java - 独立 java 应用程序的线程转储
我有一个在 Linux + Java 6 上运行的独立 Java 应用程序，它似乎被卡住了(没有生成日志)我如何在不使用任何其他工具(例如 jstack)的情况下获取此线程转储尝试了以下命令，但它们
javascript - 独立 Babel 和使用箭头函数插件？
我正在非节点环境中构建应用程序，但我想利用 Babel 的 ES6 转译，以便我可以编写更好的代码并且仍然支持 IE11。所以我继续包含在这里找到的独立文件: https://github.com/
MySQL 64 位？独立？
扩展我对 MySQL 的理解。 1) 是否需要 64 位帮助？我是安装还是单独使用？ 2) 如果我打算在 MySQL Community Service 中使用 64 位，它会影响仅提供 32 位的
java - 独立 Java 应用程序的规则引擎
我有一个独立的 Java 应用程序，我必须为其集成一个规则引擎。我应该使用属性文件或 XML 文件定义规则。我需要规则引擎来读取属性或 XML 文件中定义的这些规则，并相应地在应用程序中实现代码。任
java - 独立 Wiremock + 使用的端口
我是wiremock新手，我正在尝试使用它来记录我负责集成测试的java应用程序的请求和响应。我知道我的命令将类似于: java -jar wiremock-1.57-standalone.jar
android - 独立 RadioGroup 列表
我到处寻找我的问题的解决方案，但我的问题有点具体...我需要有关如何创建独立 radioGroup 列表的建议，例如图示: o item1 • item1' • item2 或 item2' o it

首页

博学

6Ren·AI

商城

python - 如何在 GPU 中的 Tensorflow 上并行运行独立循环